Яндекс Образование создаёт образовательные продукты для школьников, родителей и учителей, а также инструменты для всего образовательного сообщества. Мы разрабатываем технологичные решения, включая AI-инструменты, которые помогают детям осваивать IT-навыки, учиться эффективнее и получать современное образование, а взрослым — лучше понимать и сопровождать этот процесс.
Наша стратегическая цель — создать интеллектуального AI-репетитора: диалоговую систему, которая умеет вести осмысленный учебный диалог, оценивать уровень знаний, находить пробелы, объяснять сложные темы и формировать персональные рекомендации по обучению.
Мы ищем ML-разработчика с сильным бэкграундом в NLP и LLM, который будет участвовать в создании и развитии такого тьютора: от исследований и экспериментов до продакшен-систем, обслуживающих сотни тысяч пользователей.
Какие задачи вас ждут:
Улучшение базового качества диалога для достижения образовательных целей
Вы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области.
Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса).
Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом.
Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы.
Мы ждем, что вы:
- Уверенно владеете Python и работали с PyTorch
- Знакомы с основами обучения LLM
- Работали с vLLM для развёртывания LLM
- Обладаете крепкой базой знаний в ML
Будет плюсом, если вы:
- Работали с DL в области речевых технологий
- Внедряли нейросетевые модели в продакшен
- Работали с большими данными
Похожие вакансии
Высшее образование по специализации: экономика, бухгалтерский учет, анализ и аудит, финансы. Опыт работы от 2 лет в сфере финансов или...
Владеете английским языком на уровне C1 и выше. Имеете опыт активных продаж или аккаунтинга на международном рынке от 1...
Уметь открыто и интересно писать на темы о сексе, интимном здоровье и секс-товарах. ВАЖНО: умение в сжатые сроки найти...
Никакого обязательного инфостиля или Главред-статей :). Требования: Опыт работы техническим писателем в IT от 2 лет. Опыт разработки и сопровождения...
Опыт работы от 2 лет с данными, нужными для ML-решений — особенности хранения, архитектура, эффективная историчность. Опыт работы с DS...
