Мы ищем ML Engineer в RnD подразделение для работы над специализированной моделью для агентного поиска. Наша цель — переход от статических RAG-пайплайнов к адаптивным агентным системам, управляющим процессом извлечения знаний. Вам предстоит работать на стыке инженерии и исследований: создавать датасеты, обучать модели (SFT/RL) и сравнивать эффективность кастомных решений с существующими фреймворками.
Обязанности
- Разработка тестовых корзин для оценки многошагового поиска (multi-step retrieval) и сложных запросов;
- Дообучение языковых моделей (SFT, LoRA) и применение методов Reinforcement Learning (GRPO) для оптимизации стратегий поиска;
- Сравнительный анализ производительности: кастомные модели управления поиском vs агентные подходы на базе фреймворков (ReAct);
- Проектирование и поддержка пайплайнов оценки качества поиска для агентных систем.
Требования
- Опыт от 1 года коммерческой разработки в NLP с фокусом на LLM и RAG-архитектуры;
- Понимание работы и стратегий поиска (векторные модели, реранкеры, ReAct);
- Умение оценивать качество поиска (Recall, MRR, NDCG) и проектировать эксперименты для сравнения гипотез;
- Владение экосистемой: PyTorch, HuggingFace, vLLM, LangChain/LangGraph;
Будет плюсом:
- Опыт дообучения эмбеддеров или LLM;
- Опыт реализации многошаговых агентных сценариев;
- Публикации, соревнования или пет-проекты, связанные с задачей поиска.
Условия
- Кластер с GPU A100 для экспериментов;
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии
Портрет идеального кандидата: Высокая личная ответственность. Мы не стоим над душой. Вы умеете договариваться, а не просто «впаривать».
Высшее или средне-специальное техническое образование. Опыт работы в эксплуатации коммерческой недвижимости (офисные центры класса «А», «B+») не менее 3...
Опыт работы от 3 лет по проектированию светопрозрачных конструкций (СПК) и/или навесных вентилируемых фасадов (НВФ). Образование высшее строительное, инженерное.
Опыт ручного тестирования от 1-3 лет. Excel продвинутый уровень. Уверенное знание SQL на уровне базовых запросов (MS SQL Server...
Опыт работы от 1 года (общепит, рестораны будут преимуществом). Техническую грамотность и желание разбираться в оборудовании. Готовность к разъездному характеру...
