Мы ищем руководителя направления обучения больших языковых моделей, который будет отвечать за развитие качества моделей в доменной области через системное управление обучением, данными и оценкой.
Роль предполагает работу на стыке исследований, инженерии и продуктовых задач с фокусом на практическое применение моделей в бизнесе.
Обязанности
1. Развитие качества моделей
- анализ современных методов обучения LLM (SFT, RLHF/DPO, synthetic data, дистилляция)
- формирование стратегии обучения моделей под бизнес-задачи
- определение необходимых навыков модели (skills decomposition)
2. Работа с данными
- проектирование и развитие пайплайна датасетов:
- сбор, очистка, разметка, валидация
- создание обучающих и тестовых выборок
- разработка синтетических датасетов
3. Бенчмарки и оценка
- разработка и поддержка системы оценки качества моделей
- создание бенчмарков (включая domain-specific)
- проведение регулярного тестирования и сравнительного анализа моделей
- контроль регресса
4. Управление командой
- руководство командой разметки (до 40 человек) и подготовки данных (4 человека)
- постановка задач, контроль качества разметки
- разработка методологии разметки и инструкций
- работа с инструментами разметки (например, TagMe)
5. Взаимодействие с рисками и compliance
- согласование подходов к обучению с управлением модельных рисков
- контроль аспектов: галлюцинации, bias, соответствие нормативным требованиям
- обеспечение прозрачности и воспроизводимости обучения
6. Интеграция с продуктом
- работа с продуктовыми командами (LLM-агенты, RAG-системы)
- приоритизация задач обучения на основе бизнес-метрик
- участие в запуске моделей в прод
7. Экономика и эффективность
- оценка эффективности обучения (качество vs стоимость)
- выбор оптимальных стратегий: дообучение vs архитектурные изменения
- оптимизация использования вычислительных ресурсов
Требования
- опыт работы с LLM / NLP от 3–5 лет
- практический опыт обучения моделей (SFT, RLHF/DPO или аналоги)
- опыт построения датасетов и evaluation pipelines
- понимание архитектуры LLM и принципов их обучения
- опыт управления командой
- уверенное владение Python и ML-стеком (PyTorch / HuggingFace)
Будет плюсом:
- опыт работы с доменными моделями (например, legal, finance)
- опыт построения пайплайнов генерации синтетических данных
- опыт внедрения моделей в прод
- знание подходов к снижению галлюцинаций.
Условия
- комфортный современный офис на ул. Вавилова д. 19
- формат работы - фул офис
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Похожие вакансии
Базовые знания строительной сферы. Умение работать ворд, эксель. Педантичность. Многозадачность.
Высшее строительное образование (теплоэнергетическое, ПГС, промышленное и гражданское строительство — приветствуется). Опыт работы в должности начальника участка от 3 лет на...
Готовность подменять приёмщика и любого другого сотрудника склада при необходимости. Требования: Опыт работы начальником склада или старшим кладовщиком от 1...
Опыт работы управляющим / директором ресторана от 2 лет (желательно 3–5 лет). Антикризисный опыт: запуск, вывод из кризиса, увеличение выручки...
Высшее профильное образование (ПГС, архитектура, реставрация). Опыт работы с объектами культурного наследия от 5 лет, в том числе на руководящих...
