Мы — команда, создающая ядро интеллектуальных сервисов для международной аналитической платформы. Наш продукт помогает бизнесу принимать стратегические решения на глобальных рынках, используя любые типы данных — от новостных лент до внутренних баз знаний.
Мы ищем сильного и самостоятельного специалиста, который хочет заниматься автономными ИИ‑агентами, а не просто обёртками над LLM. Вы будете влиять на архитектуру, выбирать технологии и отвечать за полный жизненный цикл ML‑продукта в on‑premise‑среде.
Обязанности
- Разрабатывать production‑ready ИИ‑агентов
Проектировать multi‑agent системы для бизнес‑задач: оценка рисков, анализ контрагентов, поиск альтернативных рынков, санкционный комплаенс.
Реализовывать планирование (planning), использование инструментов (tool use), управление памятью (memory) и рефлексию агентов.
Внедрять систему оценки агентов: метрики точности, надёжности и эффективности выполнения цепочек действий.
- Создавать и оптимизировать RAG‑пайплайны
Многоканальная индексация (веб‑страницы, PDF, базы данных, устная речь)
Эксперименты с chunking, embedding‑моделями, retrieval‑стратегиями (гибридный поиск, re‑ranking, query rewriting)
- Строить высоконагруженные ML‑сервисы
Асинхронное выполнение, кеширование, rate limiting, fallback‑механизмы.
- Весь цикл ML‑продукта
От исследования и прототипирования до CI/CD, мониторинга дрейфа моделей и A/B‑тестов агентных сценариев
- Интегрировать LLM в микросервисную архитектуру
Как open‑source (Llama, Mistral, Qwen), так и коммерческие модели
Упаковка моделей в Triton, vLLM или llama.cpp для on‑premise
- Обеспечивать производительность и надёжность
Оптимизация latency / throughput, работа с ограничениями GPU, баланс между качеством и скоростью
- Работать в связке с бэкендом и продуктом
Бесшовная интеграция агентных сценариев в основную платформу.
Требования
- Опыт разработки и вывода в production LLM‑приложений, особенно агентов (LangGraph, AutoGen, CrewAI, Semantic Kernel)
- Глубокое понимание паттернов: ReAct, Reflection, Tool use, RAG, Memory (краткосрочная/долгосрочная)
- Уверенная работа с Python и ML‑стеком (PyTorch, transformers, langchain/llamaindex, vLLM, sentence‑transformers)
- Опыт с векторными БД (Milvus, Qdrant, Weaviate) и поисковыми движками (Elasticsearch, OpenSearch)
- Понимание метрик качества агентов (task success rate, token efficiency, tool accuracy) и методов оценки (LLM‑as‑judge, human‑in‑loop)
- Опыт работы с Python + FastAPI (или аналоги) – для сервисов агентов и RAG
- Опыт работы с SQL, опыт с PostgreSQL (включая pgvector)
- Опыт работы с Docker, Kubernetes (helm, kustomize)
- Опыт работы с CI/CD (GitLab CI, GitHub Actions) – автоматическое тестирование агентных пайплайнов
- Опыт работы с мониторингом: Prometheus, Grafana, Loki, а также observability LLM‑приложений (LangSmith, Arize Phoenix)
Будет плюсом:
- Опыт с fine‑tuning LLM (LoRA, QLoRA, DPO) для улучшения следования инструкциям и формату вызова инструментов
- Опыт работы с классическим ML
- Навыки оптимизации моделей (quantization, pruning, distillation) для on‑premise
Условия
- офисный или гибридный формат в Москве
- ежегодный пересмотр зарплаты и годовая премия
- расширенный ДМС и льготное страхование для семьи
- уникальная система обучения Сбера для профессионального и карьерного развития
- выгодная ипотека для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компании-партнёров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.
Похожие вакансии
Опыт с Hadoop/PostgreSQL или другой БД от 1 года. Владение SQL на продвинутом уровне (знание оконных функций, оптимизации запросов...
Имеете высшее образование или заканчиваете учиться. Опыт в ИТ приветствуется. Знаете основы SQL и не боитесь программирование. (При приеме это...
Высшее/неполное высшее профильное образование: рассматриваем также и студентов последних курсов университета. Готовность работать от 20-25 часов в неделю...
Образование среднее специальное, высшее. Опыт работы не важен. Знание ПК на уровне пользователя. Ответственность и пунктуальность. Желание обучаться и развивать...
Обожаешь общаться с людьми и дарить им положительные эмоции. Аккуратен, энергичен и легко учишься новому (всему научим!). Ценишь командный дух...
