Аналитик-разработчик в команду AI Safety Алисы

Работодатель:
Опыт работы:
От 3 до 6 лет
Место работы:
Москва

Мы ищем аналитика-разработчика в команду ML Safety Алисы, чтобы вместе строить системы оценки качества ответов как LLM, так и t2i- и i2i-моделей.

Почему у нас классно:

  • Мы работаем с Алисой AI — новым продуктом Яндекса на основе LLM — и ориентированы прежде всего на результат в продакшене
  • Наши задачи тесно связаны и с дизайном самого продукта, и с ML
  • Мы даём возможность развивать как технические, так и коммуникативные и менеджерские навыки
  • Ваша работа прямо повлияет на то, как будет выглядеть Алиса AI через полгода
  • Мы делаем уникальные по сложности, масштабу и архитектуре краудсорс-проекты
  • Наша слаженная команда аналитиков и ML-инженеров качества Поиска постоянно обсуждает задачи и обменивается опытом

Какие задачи вас ждут

Построение системы оценки качества ответов моделей
Вам предстоит разработать и внедрить системы VLM-as-a-judge и LLM-as-a-judge для автоматической оценки ответов наших моделей. Это ключевой шаг в переходе от устаревших подходов к современным методам контроля качества, который напрямую повлияет на развитие продукта.

Формализация требований к качеству продукта
Наша основная задача — превратить плохо формализованное и противоречивое определение продукта в набор чётких правил и принципов, с помощью которых мы сможем обозначить конкретный ответ как хороший (подходящий для продукта) или плохой (указывающий на ошибку в продукте) и обосновать такое решение. Сначала мы учимся делать это сами (собираем и обсуждаем примеры, пишем инструкции), а затем обучаем этому AI-тренеров и асессоров.

Аналитические задачи вокруг ML-моделей
Мы оптимизируем сбор лёрна, занимаемся валидацией и приёмкой моделей, мониторим состояние прода, ищем проблемы.

Мы ждём, что вы

  • Умеете писать на Python и SQL
  • Знаете математическую статистику и теорию вероятностей
  • Можете общаться в команде, ясно излагать мысли, понимать и убеждать коллег
  • Самостоятельны и готовы браться за новые задачи, для которых нет готового решения
  • Въедливы, готовы до мелочей разбираться в том, как и почему должен работать продукт

Будет плюсом, если вы

  • Работали с Толокой или другими краудсорс-платформами
  • Писали инструкции и самостоятельно запускали проекты разметки данных
  • Работали с машинным обучением и нейронными сетями

Похожие вакансии

Application Security Аналитик (AI)
Cloud.ru

Знание принципов работы AI-агентов/LLM/GenAI, RAG, агентских протоколов (MCP, A2A, AG-UI). Знание уязвимостей и методов...

Руководитель экспертной группы в области банковского регулирования
Diamond Personnel R&C

Фундаментальное понимание банковского бизнеса (как и зачем выстраивается функция риск-менеджмента / от чего зависит процентная маржа / как происходит прайсинг продуктов...

SEO-специалист в Финтех стартап (Senior+/Lead)
Холдинг Финанс

4+ лет в SEO, из них 1.5+ — Senior в финансы, инвестиции, ВЭД, крипто. ️Опыт в SERM и...

150 000 руб.
Руководитель РЦ (формат Hard Дискаунтер В1)
МАГНИТ, Розничная сеть

Аналогичный опыт работы от 3 лет. Опыт работы c WMS системой. Знание принципов работы 3PL провайдеров будет для вас...

Системный бизнес аналитик в команду Client Service
Тануки, японский ресторан

Необходимые профессиональные навыки и опыт: ️ опыт системного анализа от 2+ лет. ️ опыт работы с интеграциями (REST API, очереди сообщений). ️

200 000 - 200 000 руб.