О компании и продукте:
Лидер российского рынка DevOps и Kubernetes (на рынке с 2008 года). Разрабатывает экосистему продуктов для Cloud Native-разработки, включая ведущую K8s-платформу. Продукты закрывают полный спектр инфраструктурных задач: управление контейнерными нагрузками, доставку приложений, виртуализацию, наблюдаемость, хранение секретов, управление версиями, логами.
Команда ML/AI
Развивает ML/AI-направление в платформе, разрабатывает компоненты для полного жизненного цикла работы с искусственным интеллектом.
Инфраструктурный слой: единое управление GPU (обнаружение, выдача ресурсов, нарезка, профилирование для максимизации утилизации, наблюдаемость, установка и обновление компонентов видеокарт на узлах).
Инференс-слой: превращает набор рантаймов (vLLM, Ollama и др.) и оркестраторов в продуктовый опыт — пользователь выбирает модель и «движок», платформа поднимает inference-сервис.
Дальнейшее развитие: RAG/агенты, guardrails, мониторинг качества и безопасности, ML-пайплайны (Airflow, JupyterHub, MLflow, Train) и UI.
Чем предстоит заниматься:
- Писать production-grade компоненты с фокусом на стабильность, наблюдаемость, совместимость и эксплуатацию
- Проектировать и реализовывать Kubernetes-операторы / контроллеры и модули платформы
- Работать с архитектурой: принимать и обосновывать решения, декомпозировать сложные задачи
- Писать тесты (unit / integration / e2e), развивать CI, обеспечивать воспроизводимость релизов
- Документировать и улучшать UX платформы для инженеров эксплуатации и пользователей
- Спроектировать и реализовать CRD/API и контроллеры (операторы) для модуля GPU и компонентов inference-платформы
- Интегрировать рантаймы и оркестраторы инференса в модель self-service (декларативное описание ресурса → работающий сервис)
- Реализовать best practices platform engineering (идемпотентные reconciliation loops, корректная обработка ошибок, обратная совместимость, версии схем, миграции)
- Совместно с DevOps/SRE-инженерами превращать прототипы и R&D-обвязки в промышленный продукт
Требования:
- Уверенное знание Go (проектирование, concurrency, интерфейсы, тестирование, качество кода)
- Опыт разработки под Linux или Unix (от 2 лет)
- Практический опыт работы с Kubernetes (понимание принципов, написание манифестов)
- Опыт разработки под Kubernetes с использованием client-go / controller-runtime (kubebuilder), CRD, RBAC, webhooks — либо эквивалентный опыт расширения K8s API
- Понимание жизненного цикла Kubernetes-объектов, принципов scheduling / quotas / limits и работы с ресурсами
- Опыт создания production-grade компонентов
- Умение принимать и обосновывать технические решения, декомпозировать сложные задачи
- Знание классических алгоритмов и структур данных
Будет плюсом:
- GPU-стек (NVIDIA device plugin / DCGM / MIG и др.), опыт оптимизации утилизации GPU
- Опыт с KServe / KubeRay / llm-d и inference-рантаймами (vLLM / Ollama / SGLang / Triton)
- Опыт с Envoy / API gateway / service mesh, gRPC
- Опыт работы в продуктовой команде
Условия работы:
- Работа в IT-компании, аккредитованной Минцифры
- Полностью «белая» заработная плата и регулярная индексация по итогам performance reviews
- ДМС со стоматологией, страховкой от несчастных случаев и чек-апом
- Индивидуальные уроки иностранных языков (английский, немецкий, французский, итальянский, испанский)
- Компенсация 50% стоимости сессий психотерапии
- Бесплатные курсы на внутренней академии
- Полностью удалённая работа в пределах РФ (нужен только доступ в интернет)
- Современное оборудование от компании
- Органическое неприятие бюрократии
- Понятные цели и перспективы
Похожие вакансии
Развивать аналитическую культуру и подходы к отчетности в комании. Примеры задач уровня роли. Баланс скорости запуска и качества решений.
Orchestration: Airflow (и понимание альтернатив). CI/CD & Ops: K8s, Git/GitLab, Docker, Helm, ArgoCD. Что пригодится: Опыт работы...
Ты имеешь обширный опыт программирования под андроид. Ключевые навыки: Глубокие знания Android SDK под капотом. Глубокое понимание Coroutines/Многопоточности.
Технарь в душе – техническое образование будет плюсом. Имеешь навыки работы с искусственным интеллектом.
Опыт работы на проектах внедрения 1С:БП и 1С:УХ по функциональности регламентированного учета (бухгалтерский и налоговый учет).
