Senior DevOps LLM (Инвестиционный бизнес)

Работодатель:
Опыт работы:
Более 6 лет

Мы разрабатываем систему, которая автоматизирует весь жизненный цикл инвестиционной сделки. Наши команды работают над следующими направлениями:

  • алгоритмизированный и AI поиск потенциальных сделок и клиентов
  • управление процессом заключения инвестиционных сделок
  • финансовые расчеты и оценка портфеля
  • построение финансовой и управленческой отчетности по портфелю инвестиций Сбера
  • инвестиционные сервисы для компаний - наших клиентов.

Наша инвестиционная платформа ЮЛ в Сбер - это уникальная разработка на российском рынке для выдачи и сопровождения инвестиционного финансирования юридическим лицам. Такие сделки имеют большое значение для российской экономики, и о них пишут в новостях.

Вы будете работать с микросервисной архитектурой (Kubernetes, Docker, Istio, Kafka).

Мы используем specififcation-driven подход к разработке и активно развиваем эту методологию внутри Сбера.

Обязанности

  • развертывание и конфигурация Open Source LLM (DeepSeek, Qwen и др.) на собственных мощностях
  • настройка высокопроизводительных инференс-серверов (vLLM, TGI, TensorRT-LLM, llama.cpp)
  • оптимизация использования GPU (память, батчинг, quantization) для достижения требуемой пропускной способности и задержек (latency)
  • настройка систем observability для слоя инференса: сбор метрик (количество запросов, время генерации, использование VRAM, throughput, количество активных потоков/запросов)
  • реализация health checks (ready/live probes) для инференс-серверов
  • автоматизация оповещений (alerts) при деградации производительности или падении сервисов
  • настраивать сквозную трассировку (trace_id) по всей цепочке сервисов: от пользовательского интерфейса до агентов и инфраструктуры
  • развивать дашборды в Grafana для мониторинга агентов, инфраструктуры и ключевых компонентов платформы
  • внедрять кастомные метрики для агентов (запросы, статус, P95, LLM-вызовы, токены) без изменения кода агентов
  • обеспечивать корреляцию логов и трейсов для быстрого поиска инцидентов
  • настраивать алерты: технические (Pod OOM, память, ошибки) и качественные (satisfaction rate, регрессии)
  • работать с централизованным Prompt Hub для хранения и обновления промптов без деплоя
  • автоматизировать интеграцию E2E-тестов с системой трассировки
  • поднятие и конфигурация бэкенд-серверов для работы агентов (FastAPI, Node.js или других runtime)
  • контейнеризация (Docker) и оркестрация (Kubernetes / Docker Compose) компонентов системы
  • управление окружениями (dev/stage/prod) и CI/CD пайплайнами для доставки кода агентов и обновлений инфраструктуры
  • разработка агентов в структурированном формате Markdown, следуя принципам Claude/Harness Engineering (явное описание инструментов, контекста, последовательности действий)
  • создание системных промптов, определения инструментов (tools/functions) и четких границ поведения агента
  • интеграция агентов с внешними API, базами данных и DevOps-инструментами (Kubernetes, AWS, CI/CD)
  • разработка и поддержка пайплайнов CI/CD
  • внедрение новых инструментов для автоматизации и мониторинга
  • взаимодействие с командами разработки, тестирования и эксплуатации.

Требования

  • опыт развертывания и сопровождения Open Source LLM в продакшене
  • глубокое практическое знание инструментов инференса: vLLM, TGI (Text Generation Inference) или аналогичных (TensorRT-LLM, sglang)
  • понимание внутренних механизмов LLM инференса: KV-cache, continuous batching, quantization (GGUF, GPTQ, AWQ)
  • опыт написания агентов/промптов в продакшн-среде, знакомство с концепцией Harness Engineering (или готовность быстро в нее погрузиться)
  • уверенное владение Python (написание сервисов, скриптов мониторинга, интеграций)
  • экспертный опыт работы с контейнеризацией (Docker)
  • опыт управления кластерами Kubernetes: написание и поддержка манифестов, работа с Helm (чарты)
  • опыт построения и поддержки пайплайнов в Jenkins, GitLab CI
  • уверенная работа с Git (стратегии ветвления, код-ревью)
  • опыт работы с СУБД (PostgreSQL, ClickHouse или аналогичными) в контексте высоконагруженных систем
  • опыт построения observability-стека для микросервисных или агентных систем
  • навыки настройки сквозной трассировки, метрик, логирования и алертинга
  • уверенное владение инструментами: Grafana, Prometheus, Loki, Jaeger, OpenTelemetry

Будет плюсом:

  • опыт работы с фреймворками для агентов (LangChain, LlamaIndex, AutoGen, или собственные решения)
  • знание подходов к fine-tuning и evaluation LLM (например, LoRA/QLoRA, использование Axolotl или Unsloth; оценка качества через MMLU, HumanEval, ROUGE, BERTScore, фреймворки DeepEval или LM Evaluation Harness)
  • опыт управления GPU-инфраструктурой (NVIDIA A100/H100, L40S, работа с MIG, vGPU)
  • навыки администрирования Linux (сети, файловые системы,работа с драйверами NVIDIA).

Условия

  • комфортный современный офис рядом с м. Ленинский проспект, ул. Вавилова 19, формат работы - гибрид
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная програма
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Похожие вакансии

Ведущий системный аналитик (Международное финансирование)
СБЕР

Практический опыт 5+ лет проектирования систем: микросервисы и/или модульный монолит, интеграции (REST, Kafka, передача файлов), очереди, кэширование, гарантированная...

Заместитель главного энергетика
ФЕЛИКС

Высшее инженерно-техническое образование. Опыт работы на административно-технических и руководящих должностях (Главный энергетик, зам. Главного энергетика, Главный инженер) - не...

150 000 руб.
Embedded Linux Team Lead в Robotics
Яндекс

Понимаете архитектуру Linux и принципы работы пользовательского и системного пространства. Управляли командой. Владеете английским языком на уровне, достаточном для рабочей...

Ведущий аналитик (Инвестиционный бизнес)
СБЕР

Проектирование БД. Проектирование пользовательских процессов. Проектирование межсервисных взаимодействий. Понимание основы работы Kafka (продюссер, консьюмер, топики, партиции). Знание SQL, PlantUML.

Помощник/ассистент руководителя/бизнес-ассистент
Пронайм

Человека с техническим складом ума: структурного, внимательного к деталям, спокойного в задачах, где нужно разобраться, собрать информацию, разложить процесс и...

130 000 - 200 000 руб.