МТС Банк – одно из ключевых направлений экосистемы МТС.
Мы используем современные цифровые решения и развиваем технологичные банковские сервисы, доступные каждому.
Наши команды совершенствуют продукты для В2В и В2С. Создают сайты на TypeScript + React + Next.js с SSR. И реализуют проекты в Kubernetes-среде, чтобы обеспечивать надёжность для миллионов клиентов МТС Банка.
Инженер по инфраструктуре. Основная миссия - организовать надежный деплой, мониторинг и оптимизацию ресурсов для обучения и инференса моделей, гарантируя бесперебойную работу банковских сервисов.
Технологический стек:
Docker, Linux, Kubernetes, Bash, GitLab CI, Ansible, Terraform, Airflow, Python, vllm, cuda, triton, Prometheus/Victoria Metrics, Grafana, SQL, Postgres, Elasticsearch, MLflow, Qdrant, Nexus, Vault
Ты будешь:
- деплоить и интегрировать модели, сопутствующие сервисы и инструменты, автоматизировать поставку и оптимизировать потребление ресурсов
- мониторить и поддерживать работоспособность
- обеспечивать соответствие политикам информационной безопасности и стандартам надёжности при развёртывании ML‑решений
Что для нас важно:
- уверенное администрирование Linux, понимание сетевых протоколов и потенциальных точек отказа
- опыт конфигурации и распределения мощностей видеокарт для обучения и инференса моделей
- опыт настройки мониторинга инфраструктуры и метрик деградации моделей
- опыт работы с vllm, Triton Inference Server, FastAPI, KServe или TorchServe
- опыт построения сложных многоэтапных пайплайнов с упором на безопасность
Похожие вакансии
Знание технологий и протоколов на уровне CCNP (ARP, DHCP, DNS, SNMP, NAT, VLAN, STP, VRRP, OSPF, PBR, RADIUS/TACACS+, 802...
Уверенное знание ОС Linux (CentOS, Debian, Ubuntu). Хорошее знание Docker, Kubernetes, OpenShift(OKD), Kafka, GitLab, систем хранения данных.
Опыт работы сетевым инженером от 5-ти лет. Глубокие знания сетевых технологий и администрирования сетей уровня предприятия (L2/L...
Практический опыт использования linux-систем в крупных промышленных системах. Практический опыт в k8s в крупных промышленных системах.
Опыт построения и эксплуатации data pipelines (ETL, ELT и/или streaming) в produckon среде. Уверенный SQL, включая оптимизацию запросов и...
