О команде
SS-infra (Security Services Infrastructure) — команда, занимающаяся развитием и построением инфраструктуры в составе Security Services. Мы строим, автоматизируем и защищаем инфраструктуру для «красных» и «синих» команд (Penetration Testing, Red Teaming, Incident Response, Threat Hunting и др.). Покрываем весь спектр DevOps/SecOps/DevSecOps.
Роль
Ищем инженера с ML- или DevOps-бэкграундом, который перешёл в MLOps. Нам нужен инженер, готовый пилотировать, внедрять и развивать новые решения и подходы. Помимо ML-инфраструктуры, нужно быть готовым помогать команде с классическими DevOps-задачами.
Обязанности
MLOps
- Проектировать архитектуру AI-систем (от прототипа до production);
- Внедрение GPU-планировщика (Kueue, Volcano или аналог) для шаринга нагрузки на одном железе
- Проектирование и поддержка ML-пайплайнов (обучение, валидация, деплой моделей)
- CI/CD для моделей: версионирование данных, моделей, экспериментов
- Мониторинг production-моделей (drift detection, performance tracking)
- Деплой и оптимизация LLM / inference-серверов (vLLM, TGI, Triton)
DevOps
- Контейнеризация и оркестрация сервисов (Docker, K8s)
- CI/CD (GitLab CI, Jenkins)
- IaC (Terraform, Ansible)
- Мониторинг и observability (Prometheus, Grafana, Loki)
- Автоматизация рутинных операций
- Обеспечение выполнения требований ИБ в отношении инфраструктуры
- Ведение технической документации по вверенным ресурсам
Требования
- Бэкграунд в ML/DS — понимание процессов обучения, инференса, работы с данными
- Опыт от 2 лет в MLOps / DevOps с ML-спецификой (было бы огромным плюсом)
- Docker, Kubernetes (Helm, управление кластерами) — production-опыт
- Python — уверенное владение
- CI/CD (GitLab CI, Jenkins, методология GitOps)
- Глубокие знания Linux
- Terraform / Ansible для IaC
- Опыт построения или управления GPU-кластерами (NVIDIA, CUDA, nvidia-container-toolkit)
- Опыт с GPU-планировщиками (Kueue, Volcano, Run:ai)
- Опыт с MLflow, Kubeflow, Airflow или аналогами
- Высшее техническое образование
Будет плюсом:
- Опыт работы с LLM / inference-серверами (vLLM, TGI, Triton)
- Знакомство со стеком команды: Gitlab, Nginx, Kafka, RabbitMQ, Elasticsearch, Loki, Grafana, Vault, Keycloak
- Понимание специфики multi-tenant GPU-шаринга (MIG, MPS, time-slicing)
- Опыт работы с Talos OS / Flatcar
- Опыт построения гетерогенной инфраструктуры (on-premise + облака)
Похожие вакансии
Имеете высшее техническое образование. Обладаете опытом работы энергетике от 6 лет. Имеете навыки управление персоналом и подрядными организациями.
Высшее профильное образование. Опыт работы в указанной области от 3-х лет. Знание нормативной базы в области строительства, умение находить...
Опыт проектирования жилых и общественных зданий на стадии «ПД» и «РД» - желательно. Опыт работы в Revit (обязательно).
Высшее строительное образование, ПГС предпочтительно. - Опыт проектирования в геотехнике. - Базовые знания строительной механики и механики грунтов. - Уровень знания программ(Plaxis...
Высшее образование по специальности "Гидротехническое строительство". Опыт работы инженером-гидротехником - проектировщиком гидротехнических сооружений от 3 лет. Опыт разработки проектной и...
