Middle ML Developer (Voice, ASR, STT/TTS)

Работодатель:
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Ленинградский проспект, 36с40

Наша компания специализируется на разработке голосовых сервисов для телеком-индустрии. Мы внедряем наши продукты в сети крупных операторов мобильной связи, активно растем и, в связи с этим, усиливаем команду. Резидент «Сколково».

Локация: удаленно (с возможностью посещения офиса, Москва, м.Динамо)

Ищем Middle ML разработчика, который будет отвечать за разработку и масштабирование приложения для анализа и синтеза речи в режиме реального времени, также интеграции данного приложения в имеющуюся голосовую платформу.

Задачи

  • Реализация стримингового движка ASR для виртуального ассистента на основе open source библиотек
  • Участие в доработке файлового speech-to-text движка совместно с data science командой
  • Проектирование и улучшение компонент ASR, включая шумоподавление, акустическую и лингвистическую модели
  • Создание и улучшение модулей синтеза речи для диалоговых роботов
  • Обучение моделей ASR/TTS как для русского языка, так и для low source языков
  • Интеграция и масштабирование разработанных модулей в продукты компании
  • Доработка сторонних библиотек и при необходимости переписывание критичных к производительности компонент с python на другие языки
  • Оптимизация моделей и алгоритмов для обработки аудио под высокие нагрузки
  • Написание тестов и проведение нагрузочного тестирования
  • Взаимодействие с продуктовой командой, аналитиками и разработчиками платформы

Требования

  • Опыт в разработке голосовых приложений от 2х лет
  • Глубокие знания Python
  • Умение писать читаемый и тестируемый код с высокой степенью масштабируемости
  • Опыт продуктивизации голосовых ML моделей в высоконагруженных средах
  • Глубокое знание современного ML стека (pytorch, onnx, pytest, openvino, Triton Inference Server и др.)
  • Знание библиотек для работы с аудио, например: librosa, torchaudio и др.
  • Хорошее представление об известных ASR библиотеках: kaldi, nvidia nemo, espnet и др.
  • Понимание теории обработки речи и физики звука, умение работать со спектрограммами

Приветствуется

  • Знание различных языков программирования cython, С++, Erlang, SQL
  • Знакомство с инструментами: RabbitMQ, PostgreSQL, FreeSwitch
  • Опыт в телеком-проектах

Условия:

  • З/п - фикс + бонусы (уровень дохода обсуждается с финальным кандидатом)
  • Гибкий график (начало рабочего дня может обсуждаться с руководителем) при занятости full-time (40 ч/нед)
  • Формат работы: удаленный, с возможностью посещения офиса (при желании)
  • Оформление с соблюдением всех норм ТК РФ
  • ДМС (после 3 мес. испытательного периода)

Похожие вакансии

MLOps/AI-инженер/ML-разработчик
Проф

Python продвинутый (асинхронность, работа с API, multiprocessing). Опыт с диффузионными моделями (Stable Diffusion, ComfyUI, ControlNet). Опыт с анимацией лица и...

C#-разработчик, Товародвижение и коммерция
Ozon

Уверенное знание C# (.NetCore) и опыт работы с ним от 2-х лет. Умение писать эффективный код.

Go-разработчик, Товародвижение и коммерция
Ozon

Опыт промышленной разработки от 2-3 лет. Умение работать в команде из разработчиков, аналитиков, тестировщиков, продактов. Навык находить простые решения...

AI/AI-agent developer Senior
ИЦ АЙ-ТЕКО

Опыт работы в роли разработчика от 4 лет в проектах по разработке ПО с использованием инструментов и технологий Python.

220 000 руб.