Работодатель:
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Летниковская улица, 10с4
Обязанности:
- Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов
- Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain)
- Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов
- Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии
- Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек)
- Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов)
- Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру
- Оптимизировать производительность инференса моделей
- Опыт разработки на Python от 3 лет
- Знание асинхронного программирования (asyncio/aiohttp) будет плюсом
- Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга
- LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
- RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
- Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
- Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
- Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
- Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
- Оформление по ТК, белая заработная плата
- Оплачиваем питание в офисе
- ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний
- Ежегодная индексация оклада
- Годовая премия 10% от годового оклада
- Софинансирование фитнеса
- Корпоративные курсы английского языка
- Оплата обучения до 100 000 р в год
Похожие вакансии
AI Engineer (Agents & Orchestration)
Артсофт-Технологии
Python Expert: Глубокое знание асинхронного программирования (FastAPI, мониторинг, логирование). LLM Frameworks: Опыт работы с LangGraph (приоритет), LangChain или CrewAI.
AI Engineer / AI Automation Specialist / AI Workflow Engineer
Матузова Олеся Васильевна
Опыт работы с OpenAI API, Claude API, Gemini API, Anthropic. Навыки Python / JavaScript / TypeScript. Понимание API, webhook, automation logic.
AI инженер
Констант ворк
Системного интегратора с опытом от 5 лет, который с первого дня возьмёт на себя управление проектом автоматизации: ИИ-скрипты.
150 000 - 250 000 руб.
AI инженер-тестировщик
Prooftech IT
Уверенно пользуешься Linux. Понимаешь основы клиент-серверной архитектуры. Можешь написать простой SQL-запрос. Интересуешься автоматизацией тестирования. Знаешь основы Python и...
AI Engineer (International AI Brand)
MT Lab
5+ years total engineering experience, incl. solid backend work in Python. 2–3+ years working with ML/AI...
5 000 - 7 000 USD
