Основные обязанности:
- Поддержка и развитие CI/CD, Infrastructure as Code и Kubernetes-платформы
- Проектирование и развитие наблюдаемости (Observability): метрики, логи, трейсы, алертинг, дашборды (Prometheus, Grafana, OpenTelemetry, Loki и др.)
- Диагностика и устранение узких мест: профилирование приложений и инфраструктуры, анализ производительности, тюнинг конфигураций K8s, ОС, сетевых компонентов и СУБД
- FinOps и оптимизация затрат: мониторинг и анализ расходов на облачные ресурсы, балансировка между стоимостью и надежностью
- Автоматизация рутинных операций, участие в ревью архитектуры и улучшении стабильности системы
Наши пожелания к знаниям и опыту:
- Опыт работы в роли DevOps/SRE/Platform Engineer не менее 2 лет
- Уверенное владение Linux и Kubernetes (эксплуатация, отладка, оптимизация ресурсов, понимание работы контроллеров, CNI, CSI)
- Практический опыт построения и поддержки CI/CD (GitLab CI, GitHub Actions, ArgoCD и др.) и IaC (Terraform, Pulumi)
- Глубокое понимание принципов наблюдаемости и мониторинга: умение проектировать алерты, настраивать сбор метрик/логов/трейсов
- Навыки диагностики производительности: анализ bottlenecks, понимание сетевого стека, балансировки нагрузки
- Опыт работы с облачными платформами (Yandex Cloud, Cloud.ru, AWS/GCP/Azure)
- Знание основ сетевой маршрутизации, DNS, HTTP/gRPC, TLS
Будет плюсом:
- Опыт работы с сервис-мешами (Linkerd/Istio)
- Понимание методологий SRE (SLI/SLO, error budget, incident response, основы chaos engineering)
- Сертификации в области Cloud/Kubernetes/SRE/FinOps
Мы предлагаем:
- Работа в коллективе ИТ-профессионалов
- Возможность самореализации в амбициозных проектах цифровой трансформации компании-лидера в своей отрасли
- Отсутствие бюрократии и дух стартапа
- Стабильный работодатель
- Достойный уровень оплаты, годовой бонус
- Конкурентоспособный социальный пакет
- Официальное трудоустройство в собственную аккредитованную ИТ компанию со всеми преимуществами
- Гибридный график работы.
Похожие вакансии
Опыт работы Linux (Ubuntu). Знание Docker (k8s, argocd). Умение диагностировать базы данных (PGSQL/ Cassandra/ Clickhouse). Monitoring (Zabbix, Grafana...
Высшее техническое образование. Наличие опыта с Kafka. Опыт работы с развертыванием, тюнингом, траблшутингом, отказоустойчивостью. Уверенный пользователь linux/unix.
Уверенные знания в установке, настройке и администрировании ПО под Linux RHEL 7/8, CentOS 7/8, понимание устройства и работы...
Понимание целей внедрения DevOps. Понимать особенности эксплуатации Python приложений. Опыт разработки CI/CD пайплайнов с использованием GitLab. Опыт работы с...
Развивать подход GitOps и совершенствовать процессы CI/CD. Уверенная экспертиза в Kubernetes. Опыт работы с Observability-инструментами (в частности, стек...
