Мы ищем талантливого Data Scientist для нашей команды, которая проводит исследования и разработки в области NLP и работает с компьютерным зрением. Нам нужен кандидат, который уже имеет успешный коммерческий опыт обучения генеративных NLP моделей, отлично владеет PyTorch и готов развиваться в этой области.
Наш стек:
- Для моделей PyTorch, Scikit-learn;
- NLP: transformers, pymorphy, spacy, NLTK;
- CV: OpenCV;
- SQL (ClickHouse, Vertica), Hadoop (PySpark) AirFlow, MLFlow, Grafana;
- В прод выкатываем через NVIDIA Triton (ONNX, TensorRT);
- Confluence, Jira.
Задачи:
- Разработка и обучение моделей машинного обучения для задач NLP и компьютерного зрения;
- Анализ и обработка данных;
- Работа с PyTorch;
- Участие в R&D проектах;
- Тестирование и оптимизация моделей;
- Поддержка существующих моделей.
Нам важно:
- Коммерческий опыт обучения генеративных NLP моделей от 2 лет;
- Опыт обучения дискриминативных моделей;
- Уверенное знание Python и PyTorch;
- Знание алгоритмов и структур данных уровня LeetCode Medium;
- Отличное знание классического ML и DL;
- Опыт самостоятельного ведения задач на разных этапах проекта;
- Опыт работы с большей частью нашего стека.
Будет плюсом:
- Опыт работы с полным циклом обучения моделей от сбора данных до вывода в прод;
- Опыт работы с CV задачами.
Похожие вакансии
Образование не ниже среднего-специального, профильное «бухучет, анализ и аудит». Знание программ 1С Предприятие 8.3, 1С ЗУП.
Имеет успешный опыт работы главным бухгалтером (с подтверждением в трудовой). Имеет опыт ведения учета самостоятельно, от первички до баланса.
Ты уверенно себя чувствуешь в B2B контент-маркетинге, знаешь, о чем и как писать. Можешь корректно оценить влияние...
Высшее профильное образование (бухгалтерия, финансы, экономика). Опыт работы бухгалтером в строительной компании от 3 лет, знание всех участков учета.
Сильные знания в основном стеке технологий нашей команды. Будет плюсом знание других языков бэкенд разработки. Понимание архитектурных паттернов и best...
