ML‑разработчик (Middle, Inference & MLOps)

Работодатель:
Зарплата:
200 000 руб.
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Большая кольцевая линия, метро Народное Ополчение

Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных инженерных решений.

Чем предстоит заниматься:

  • Приводить код DS к продакшен‑качеству: выполнять рефакторинг, выстраивать структуру проекта, писать тесты, настраивать логирование;

  • Конвертировать и компилировать модели в ONNX, TensorRT и RKNN; настраивать рантаймы под разные типы оборудования (CPU, GPU, edge‑устройства);

  • Оптимизировать инференс: проводить профилирование, устранять узкие места (ботлнеки), добавлять кастомные операции;

  • Использовать Triton Inference Server для деплоя и оркестрации моделей: настраивать конфигурации и маршрутизацию запросов;

  • Разрабатывать и поддерживать сервисы‑обвязки для инференса моделей;

  • Проводить нагрузочное тестирование сервисов инференса, выявлять узкие места и оптимизировать производительность;

  • Совместно с DevOps развёртывать модели: обеспечивать контейнеризацию (Docker), реализовывать базовый CI/CD;

  • Настраивать мониторинг и алертинг для моделей и сопутствующих сервисов: отслеживать метрики производительности, ошибок и деградации качества;

  • Развивать и настраивать внутреннюю MLOps‑платформу (ClearML): вести трекинг экспериментов, версионировать датасеты и модели, настраивать пайплайны.

Мы ожидаем:

  • Не менее 3 лет коммерческой разработки на Python; сформированную культуру разработки — в том числе навыки тестирования, логирования, типизации, соблюдения принципов чистого кода и выстраивания понятной структуры проектов;

  • Опыт работы с фреймворками машинного обучения (преимущественно PyTorch);

  • Понимание особенностей инференса моделей в продакшене: таких параметров, как latency и throughput, ограничений по памяти, а также принципов батчинга;

  • Практический опыт работы с ONNX и базовые знания TensorRT; готовность углубляться в вопросы оптимизации;

  • Опыт работы с Docker — в частности, сборки образов и базовой отладки контейнеров;

  • Опыт интеграции моделей в backend‑сервисы (микросервисы, API, очереди) — хотя бы на уровне совместной работы с командой;

  • Готовность осваивать Triton Inference Server и ClearML при отсутствии глубокого опыта: умение изучать документацию, экспериментировать и доводить задачи до результата;

  • Умение читать чужой код, аккуратно его дорабатывать и поддерживать коммуникацию с авторами (DS‑специалистами).

Будет плюсом:

  • Практический опыт деплоя моделей через Triton Inference Server;
  • Опыт работы с системами мониторинга (Prometheus, Grafana или аналогичные);
  • Опыт нагрузочного тестирования (locust);
  • Опыт оптимизации под конкретное железо (GPU‑серверы, edge‑устройства, специализированные ускорители);
  • Опыт работы в продуктовых командах, где ML‑модели живут в продакшене и регулярно обновляются.

Мы предлагаем:

  • Работу в аккредитованной IT-компании и Трудоустройство в соответствии с ТК РФ;
  • Систему наставничества и комфортную адаптацию в компании;
  • Возможности для профессионального и карьерного роста.

Похожие вакансии

Senior/Staff MLOps Engineer
RWB (Wildberries & Russ)

Есть опыт работы в DevOps не менее 5 лет. Имеете опыт деплоя/администрирования баз данных (PostgreSQL, Milvus или других векторных...

Middle UX/UI дизайнер (Чат поддержки в СБОЛ)
СБЕР

Опыт работы продуктовым дизайнером по созданию мобильных интерфейсов. Глубокое понимание принципов UX/UI и различий Human Interface Guidelines от Material...

Senior/Middle Python (GigaСhat Enterprise)
Салют для Бизнеса

Опыт коммерческой разработки на Python от 3 лет. Уверенный уровень Middle+ и выше. Опыт разработки на синхронных и асинхронных фреймворках.

Middle/Senior Android-разработчик (Госуслуги)
РТЛабс

Опыт коммерческой разработки под Android от 3 лет. Знание Kotlin, Android SDK. Понимание и применение принципов ООП и SOLID, Сlean...

Старший ML разработчик в команду платформы обучения моделей
СБЕР

Коммерческий опыт Python разработки от 5 лет. Опыт разработки сервисов, в том числе WEB. Опыт разработки асинхронных сервисов.