AI-engineer

Работодатель:

Чернышов Григорий Васильевич

Опыт работы:

От 3 до 6 лет

Место работы:

Москва, Летниковская улица, 10с4

Обязанности:

Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов
Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain)
Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов
Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии
Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек)
Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов)
Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру
Оптимизировать производительность инференса моделей

Требования:

Опыт разработки на Python от 3 лет
Знание асинхронного программирования (asyncio/aiohttp) будет плюсом
Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга
LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.

Условия:

Оформление по ТК, белая заработная плата
Оплачиваем питание в офисе
ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний
Ежегодная индексация оклада
Годовая премия 10% от годового оклада
Софинансирование фитнеса
Корпоративные курсы английского языка
Оплата обучения до 100 000 р в год

AI-engineer

Похожие вакансии

Популярные профессии