ML Engineer в центр робототехники

Работодатель:
Опыт работы:
От 3 до 6 лет

В Центре робототехники Сбера мы обучаем модели, которые должны управлять роботами в сложных реальных условиях. Для этого мало просто собрать большое количество данных: нужно понимать, какие записи полезны, где в них ошибки и каких примеров модели не хватает. Сейчас нам нужен Data Analyst / Data Engineer в Data Conveyor Team, который будет находить проблемы в данных, оценивать их качество и проверять через обучение моделей, как состав датасета влияет на результат.

Это роль на стыке анализа данных, инженерии данных и практических ML-экспериментов: нужно не только строить проверки качества, но и запускать обучение или дообучение моделей на разных версиях данных, сравнивать метрики и превращать выводы в конкретные решения по сбору, разметке, фильтрации и выборке.

Обязанности

- Строить автоматические и полуавтоматические пайплайны проверки качества данных, чтобы находить технические и смысловые дефекты до попадания данных в обучение.

- Запускать или сопровождать обучение и дообучение моделей на разных версиях датасетов, чтобы измерять влияние качества, состава и фильтрации данных на метрики модели.

- Разрабатывать метрики качества данных и использовать их как диагностический сигнал до тех пор, пока не доказана связь с успешностью модели на роботе и в тестовых сценариях.

- Формировать фильтры, уровни качества и стратегии выборки по качеству, разнообразию, задачам, объектам, окружениям, роботам, источникам и типам ошибок.

- Проводить сравнительные эксперименты с составом данных, чтобы проверять, какие данные действительно помогают модели, а какие можно исключить или отправить на доработку.

- Анализировать ошибки модели и переводить их в конкретные запросы на данные: что дособирать, что переразметить, что удалить, что добавить в выборку.

- Готовить теги задач, объектов, окружений и ошибок, эталонные наборы примеров, правила контроля качества разметки и критерии приемки.

- Исследовать, как изменения камер, конфигурации робота, калибровки или других сенсоров влияют на качество данных и результат модели.

- Готовить краткие технические отчеты: гипотеза, данные, метрики, ограничения, выводы, рекомендуемые изменения для релиза датасета или плана сбора данных.

Требования

- 3+ года опыта в data analysis, data engineering, ML engineering, applied ML или близкой области.

- Уверенный Python: pandas/polars, numpy, visualization, notebooks, batch data processing.

- SQL и опыт работы с большими датасетами, manifests, metadata, dashboards или analytics pipelines.

- Понимание экспериментального дизайна: ablations, контрольные группы, statistical reliability, интерпретация метрик.

- Базовое понимание ML training / eval loop и связи состава данных с метриками модели.

- Умение анализировать мультимодальные данные: видео, временные ряды, actions, task metadata, labels.

- Способность переводить наблюдения из данных и ошибок модели в actionable recommendations.

- Хорошая письменная коммуникация для отчетов, журналов решений и постановки задач смежным командам.

Будет плюсом:

- Опыт с robot learning, VLA, imitation learning, RL, CV/VLM datasets или embodied AI.

- Опыт с W&B, MLflow, Hydra, experiment tracking, dataset lineage.

- Опыт с annotation QA, active learning, data curation, anomaly detection или quality scoring.

- Понимание domain shift, camera shift, embodiment gap, task transfer и data-centric AI.

Условия

  • Дружный и высококвалифицированный коллектив
  • Уникальные масштабные проекты, работа в приоритетном направлении
  • Достойная заработная плата (оклад + годовая премия)
  • Современные рабочие места и программное обеспечение
  • ДМС, корпоративная пенсионная программа, страхование от несчастных случаев, социальные гарантии, корпоративные мероприятия
  • Высокий уровень корпоративной культуры
  • Работа в офисе (г. Москва, метро Автозаводская)

Похожие вакансии

Инженер-схемотехник (электронщик)
НПО РУСТЕХДРОН

Опыт сквозной разработки электронных устройств от идеи до серии (портфолио или примеры реализованных проектов обязательны). Свободное владение Altium Designer или...

Администратор в клуб Spirit. Fitness ( м. Раменки)
Сеть фитнес-клубов Spirit

Навыки легкой и уверенной коммуникации, доброжелательность и чувство такта. Грамотная устная речь, умение содержательно и лаконично излагать суть.

70 000 - 80 000 руб.
Инженер-сметчик
ДжиЭмЭс

Образование средне -техническое, высшее. Опыт работы в должности инженера-сметчика не менее года (опыт работы по направлению -- устройство фасада и...

Старший менеджер в отделение банка (м. Тимирязевская)
Московский Кредитный Банк

Образование не ниже среднего специального. Опыт работы в продажах от 1 года. Опыт работы в финансовых организациях от 6 месяцев.

130 000 руб.
Инженер по тестированию
СБЕР

Опыт работы тестировщиком ПО от 3 лет. Базовые знания в области искусственного интеллекта (понимание принципов работы LLM, опыт тестирования чат...