Работодатель:
Опыт работы:
Более 6 лет
Место работы:
Москва, улица Обручева, 23с1
Ищем AI / Backend Engineer, который будет заниматься развитием продуктов: виртуального DBA (ИИ-агент, который позволяет делать автоматизированную БД и помогает с её настройкой) и корпоративного агента.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAI‑compatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAI‑compatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Чем предстоит заниматься:
Разработкой backend‑сервисов для взаимодействия с LLM
- разработкой CLI-агентов для кодинга;
- реализацией механизмов работы с мультмодальными моделями на backend (например, для отправки изображений в VLM или транскрибации аудио при помощи ASR-моделей);
- реализацией и тюнингом agent loops (ReAct,CodeAct и других);
- разработкой и доработкой механизмов context engineering: сборкой контекста, compaction, summarization, tool masking;
- интеграцией инструментов через MCP‑серверы;
- работой с LLM inference инфраструктурой (vLLM / SGLang);
- реализацией streaming взаимодействия и long‑running inference;
- развитием observability и трассировкой работы AI‑агентов.
Мы ожидаем:
- уверенный опыт с асинхронным Python или любым другим backend‑языком;
- понимание возможностей и ограничений современных LLM;
- опыт работы с OpenAI API;
- понимание принципов context engineering;
- навык использования AI как инструмента ускорения разработки/исследований;
- понимание важности unit и integration тестов, роли тестов как механизма контроля качества AI‑сгенерированного кода;
- опыт использования моделей для генерации и улучшения тестов;
- инженерный подход, готовность вести полный цикл задачи;
- опыт работы в команде, высокие коммуникативные навыки.
Будет плюсом:
- опыт разработки agent‑based AI систем;
- опыт с infinite-loop агентами;
- работа с self‑hosted inference (vLLM, SGLang);
- разработка MCP‑серверов;
- оптимизация latency и token usage;
- benchmarking LLM моделей;
- опыт разработки при помощи code agents / AI‑assisted development;
- использование spec‑driven development;
- умение формализовать задачу перед генерацией кода;
- использование моделей для генерации тестов, рефакторинга и ускорения разработки.
Мы предлагаем:
Похожие вакансии
Backend Engineer (Node.js, TypeScript, Data, Real-time)
DataLouna
Сильный backend-фундамент: данные, надёжность, асинхронщина, продакшн-мышление. Умение работать с неопределённостью: уточнять цель, исследовать варианты и приносить решение.
3 500 - 5 500 USD
Python-разработчик / Backend Engineer (Middle+/Senior)
МФК Фордевинд
Опыт и профиль: опыт работы в роли Python / Backend Engineer уровня Middle+/Senior в небольших сильных командах. Работа с кодовой...
250 000 - 350 000 руб.
Главный инженер
Пиклема
Опыт руководства инженерной командой от 3 лет. Опыт работы в горнодобывающей отрасли или с горнодобывающими компаниями в роли подрядчика.
Reverse Engineer / Researcher JavaScript
ZennoLab
Опыт исследований и reverse engineering чужого кода на JS. Опыт работы с Chromium, знание ChromiumDevTools Protocol. Опыт работы с JS...
250 000 руб.
MLOps Engineer / Инженер ML-инфраструктуры
NGENIX
Создать обучающие материалы и best practices для пользователей. Опыт построения ML-пайплайнов end-to-end: от данных до деплоя модели...
