Инженер LLM / SRE (LLM-платформа)

Работодатель:
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 42с1

О проекте
Локальная мультиагентная платформа для анализа бизнес‑процессов на основе LLM. Платформа развёртывается в инфраструктуре заказчика (on‑premise), интегрируется с корпоративными системами и масштабируется на новые бизнес‑случаи.

Наша задача — создать надёжную, управляемую и защищённую AI‑платформу, готовую к промышленной эксплуатации.

Кого мы ищем
Опытного инженера LLM / SRE, который сможет сочетать навыки backend‑разработки, работы с LLM и эксплуатации.

Вы будете отвечать за разработку мультиагентных сценариев, развёртывание локальных моделей, интеграции и обеспечение стабильной работы платформы.

Ключевые обязанности

  • Разработка, развёртывание и сопровождение мультиагентной архитектуры (агенты, маршрутизация, RAG‑конвейеры).
  • Проектирование и оптимизация промптов, систем контроля качества генерации и agent‑flows.
  • Развёртывание локальных LLM, управление версиями моделей и оптимизация inference.
  • Интеграция с корпоративными системами через REST/API, обеспечение безопасности передач данных.
  • Настройка CI/CD процессов для микросервисов (Docker, GitLab CI/GitHub Actions), автоматизация развёртываний и откатов.
  • Настройка мониторинга, логирования и алертинга (Prometheus, Grafana, Loki/ELK), сбор метрик качества генерации.
  • Участие в инцидент‑менеджменте, root cause analysis и повышении надёжности (SRE‑взаимодействия).
  • Подготовка документации, обучение внутренних команд и поддержка code review.

Требования (обязательные)

  • Python 3.10+ — уверенная разработка сервисов, знание async/await, практический опыт написания тестов.
  • Практический опыт работы с LLM / Generative AI: PoC или production‑проекты, ежедневное использование моделей в инженерной деятельности.
  • Опыт построения RAG‑pipeline и работы с фреймворками вроде LangChain / LlamaIndex / LangGraph.
  • Опыт развёртывания серверных приложений в Linux‑окружении.
  • Уверенное владение Docker и Docker Compose; базовые навыки оркестрации (Kubernetes).
  • Опыт интеграции через REST API, умение работать с корпоративными системами.
  • Готовность к работе on‑premise / гибридно; технический английский для чтения документации.

Желательные навыки (будут преимуществом)

  • Опыт эксплуатации AI‑инфраструктуры: управление моделями, настройка inference на CPU/GPU, оптимизация latency.
  • Опыт работы с векторными базами (Qdrant, Milvus, pgvector).
  • Навыки SRE/DevOps: Prometheus, Grafana, Loki/ELK, GitLab CI/GitHub Actions на production‑уровне.
  • Опыт работы с Yandex Cloud / Yandex AI Studio.
  • Опыт PostgreSQL, Redis, SQL.
  • Опыт в MLOps и управлении ML‑pipelines.

Опыт

  • Коммерческий опыт разработки: от 2 лет (или эквивалентные проекты/портфолио).
  • Практический опыт с LLM/GenAI: от 1 года (PoC или production).
  • Docker/Linux/развёртывание серверных приложений: от 1 года.

Примеры реальных задач

  • Свернуть RAG‑pipeline по корпоративной документации, снизив latency и сохранив точность поиска.
  • Настроить CI/CD процесс для обновления локальной модели с автоматическим откатом при регрессе.
  • Построить метрики качества генерации и интегрировать мониторинг с алертами при деградации.

Soft skills и культура

  • Умение формализовать требования и коммуницировать с заказчиком.
  • Самостоятельность, ответственность за участок платформы, умение приоритизировать задачи.
  • Готовность к командной работе в кросс‑функциональной команде инженеров и ML‑research.

Условия работы

  • Формат: on‑premise / гибрид (точный режим обсуждается на собеседовании).
  • Проектная занятость (+/-6 месяцев).
  • Команда: компактная команда инженеров и ML‑research.
  • Конкурентная оплата.

Как откликнуться
В сопроводительном письме, пожалуйста, опишите кратко один проект с LLM: цель, стек, ваша роль, результат (включая метрики, если есть).

Похожие вакансии

Главный инженер по пусконаладочным работам (направления: ОВиК)
Артэникс

Определить, какими документами и признаками подтверждается успешное прохождение испытаний и достижение проектных параметров. Использовать существующие шаблоны как основу для корректного...

150 000 - 230 000 руб.
Инженер-Разработчик DocsVision
Jobers

Опыт внедрения или разработки на DocsVision от 1 года (обязательно). Опыт в ИТ от 5 лет. Уверенное владение C#, TypeScript...

100 000 - 160 000 руб.
Инженер ПТО
Билдсервис

Наши пожелания к опыту и навыкам кандидата: * Опыт работы инженером ПТО в генподрядной организации. * Знание требований нормативных технических и руководящих...

Инженер ПТО
БТЕ

Образование строительное / техническое высшее. Опыт работы от 3-х лет инженером ПТО (слаботочные системы, проекты ПОДД). Уверенный пользователь ПК (AutoCad...

160 000 руб.
Инженер пусконаладочных работ
Инфосистемы Джет

Опыт работы инженером пусконаладчиком, инженером по слаботочным системам или инженером по системам безопасности не менее 3 лет. Практический опыт самостоятельного...