Работодатель:
Опыт работы:
Более 6 лет
Место работы:
Москва, улица Обручева, 23с1
Ищем AI / Backend Engineer, который будет заниматься развитием продуктов: виртуального DBA (ИИ-агент, который позволяет делать автоматизированную БД и помогает с её настройкой) и корпоративного агента.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAI‑compatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAI‑compatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Чем предстоит заниматься:
Разработкой backend‑сервисов для взаимодействия с LLM
- разработкой CLI-агентов для кодинга;
- реализацией механизмов работы с мультмодальными моделями на backend (например, для отправки изображений в VLM или транскрибации аудио при помощи ASR-моделей);
- реализацией и тюнингом agent loops (ReAct,CodeAct и других);
- разработкой и доработкой механизмов context engineering: сборкой контекста, compaction, summarization, tool masking:
- интеграцией инструментов через MCP‑серверы;
- работой с LLM inference инфраструктурой (vLLM / SGLang);
- реализацией streaming взаимодействия и long‑running inference;
- развитием observability и трассировкой работы AI‑агентов.
Мы ожидаем:
- уверенный опыт с асинхронным Python или любым другим backend‑языком;
- понимание возможностей и ограничений современных LLM;
- опыт работы с OpenAI API;
- понимание принципов context engineering;
- навык использования AI как инструмента ускорения разработки/исследований;
- понимание важности unit и integration тестов, роли тестов как механизма контроля качества AI‑сгенерированного кода;
- опыт использования моделей для генерации и улучшения тестов;
- инженерный подход, готовность вести полный цикл задачи;
- опыт работы в команде, высокие коммуникативные навыки.
Будет плюсом:
- опыт разработки agent‑based AI систем;
- опыт с infinite-loop агентами;
- работа с self‑hosted inference (vLLM, SGLang);
- разработка MCP‑серверов;
- оптимизация latency и token usage;
- benchmarking LLM моделей;
- опыт разработки при помощи code agents / AI‑assisted development;
- использование spec‑driven development;
- умение формализовать задачу перед генерацией кода;
- использование моделей для генерации тестов, рефакторинга и ускорения разработки.
Мы предлагаем:
Похожие вакансии
Инженер-координатор отдела продаж (Bitrix24)
СалюТех
Высшее техническое образование (профильные вузы: МГТУ, МЭИ, МАИ, БНТУ и др.). Опыт работы в технической сфере от 3-5 лет...
80 000 - 100 000 руб.
Engineering manager (Метрики)
X5 Tech
Навыки управления и организации работ в производстве программных продуктов. Бекграунд в разработке: Go, Python, C++, C# и т.д.
DevOps-инженер (ПЦ "Управление ресурсами предприятия")
Diasoft
Наличие высшего технического или инженерного образования. Релевантный опыт работы от 2-х лет. Опыт работы с системами мониторинга и логирования...
Linux System Engineer
Бэнкс Софт Системс
Владение инструментами автоматизации AWX/Ansible. Высокая компетенция в работе с ALD Pro и навыки разработки автоматизации на его базе.
Presale-инженер (облака)
КРОК
Опыт проектирования сетевых архитектур на базе инфраструктурных продуктов. Глубокие знания современных инфраструктурных технологий и сервисов, принципов построения и эксплуатации компьютерных...
