Senior Deep Learning Engineer (Speech / Audio Foundation Models)

Работодатель:
Опыт работы:
От 3 до 6 лет

Мы ищем сильного Deep Learning инженера для развития и вывода на принципиально новый уровень GigaAM — лучшей open-source модели для распознавания речи на русском языке.

GigaAM — это не только исследовательский проект, но и core-модель, которая определяет качество работы многих ключевых продуктов экосистемы: GigaChat Audio, ASR, TTS, GigaChat Video и других.

Сейчас мы стоим перед масштабным вызовом: кратное увеличение параметров модели, масштабирование данных на несколько порядков, расширение языкового покрытия и выход за рамки распознавания речи в сторону general audio understanding. Если вы хотите создавать state-of-the-art решения, которыми будут пользоваться миллионы, и вносить вклад в развитие мирового open-source — нам по пути!

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • Масштабирование данных: увеличение объемов данных для обучения на несколько порядков, построение эффективных пайплайнов их фильтрации и подготовки.
  • Развитие архитектуры и метода предобучения: улучшение мультиязычных свойств модели и расширение ее возможностей в сторону анализа аудио неречевой природы.
  • Scaling laws: масштабирование модели по количеству параметров в несколько раз.
  • Research & Engineering: стабилизация процессов предобучения, проведение ML-экспериментов, проверка гипотез и доведение результатов до прода и публикаций.

Требования

уверенное владение Python и PyTorch

Distributed Training: практический опыт распределенного обучения, понимание ограничений и принципов работы под капотом (DDP, FSDP, ZeRO).

Опыт оптимизации DL-пайплайнов: профилирование и оптимизация узких инфраструктурных мест в процессе обучения (I/O bottlenecks, memory management, GPU utilization).

Экспертиза в Speech/Audio: понимание современных подходов и state-of-the-art архитектур в Speech/Audio Self-Supervised Learning.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Похожие вакансии

SDET инженер (Mock системы), Ozon Банк
Ozon

Знаете и понимаете основные принципы тестирования и автоматизации. Знаете SQL на базовом уровне (знание Postgres будет плюсом). Знаете Golang и...

Ведущий геодезист (м. Фили)
Строительная компания ФЛАН - М

Высшее образование (геодезическое). Релевантный опыт работы не менее 3- лет. Опытный пользователь AutoCad, CIVIL 3D. Знание нормативной технической документации.

Главный юрист по корпоративному праву и M&A
Белякова Екатерина Владиславовна

Опыт работы юристом от 7–10 лет, в т.ч. материнских/управляющих компаниях холдингов, IT‑холдингах. Глубокие знания гражданского и...

250 000 руб.
Ведущий бухгалтер 1С ЕРП
РДВ Технолоджи

Высшее экономическое образование. Актуальные знания бухгалтерского и налогового законодательства в части производственного и складского учета. Ежегодные курсы повышения квалификации по...