Работодатель:
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Овчинниковская набережная, 18/1с2

Ищем Middle+/Senior Data Scientist в команду Умного поиска Самоката.

Основной фокус: улучшение качества ответов и выдачи, работа с поисковым пайплайном, LLM/RAG и аналитикой качества, плюс реализация изменений в Python-коде сервиса.

Задачи:

  • Улучшение качества поиска и ответов: разбор ошибок, поиск паттернов, предложение гипотез;
  • Улучшение и доработка RAG;
  • Доработка эмбеддинг-моделей;
  • Настройка и улучшение метрик качества (precision/recall, offline eval, LLM-as-judge);
  • Проведение offline-экспериментов и подготовка изменений в продовом пайплайне;
  • Написание production-кода на Python (FastAPI, asyncio), тестов, бенчмарков;
  • Анализ влияния изменений на latency/качество/стоимость LLM;
  • Написание промптов.
  • Дообучение эмбеддинг-моделей, классификаторов и PEFT-адаптеров.

Наши ожидания:

  • 2+ года в DS / NLP.
  • Хороший Python (чистый код, тесты, работа с продовым кодом).
  • Сильная база в метриках и экспериментах.
  • LLM, RAG, prompt engineering.
  • Опыт с эмбеддингами для поиска
  • Умение проводить error analysis и превращать его в продуктовые гипотезы.
  • FastAPI / asyncio

Желательные навыки:

  • Опыт с LLM в поиске
  • Опыт работы с high-load системами
  • Опыт фаинтюна LoRA-моделей
  • RLHF
  • LLM-as-judge
  • Kubernetes, Helm

Стек команды:

Разработка: Python, PyTorch, FastAPI, Pydantic, GitLab, Docker, Prometheus, Grafana;
ML инфраструктура: JupyterHub, MLFlow, Airflow, PostgreSQL;
ML: Transformers, SGLang, Triton;
Процессы: Jira, Confluence.

Похожие вакансии

Инженер по управлению данными продукта (PLM Data Manager)
Яндекс

Получили высшее техническое образование. Работали с данными в PLM. Знаете структуру XML. Знаете MS Excel.

Middle Data Scientist
СБЕР

Высшее образование. Опыт работы и глубокое понимание классического ML не менее 3х лет. Продвинутые знания статистики и машинного обучения.

DevOps-инженер (Data Platform)
edna

Имеет опыт работы DevOps-инженером от 5 лет (в поисках middle+ специалиста и выше). Имеет опыт поддержки продуктовых команд на...

Senior Data Engineer
Marfatech

5+ лет опыта работы с данными. Самостоятельность - способность разобраться в проблеме и довести решение до конца без микроменеджмента.

Team Lead Data Engineer (продуктовое направление)
Циан

Опыт руководства data engineering или платформенной командой от 5 человек. Понимание data platform architecture, data contracts, lineage, monitoring, reliability.