SRE - инженер по обеспечению надёжности инфраструктуры

Зарплата:
250 000 - 400 000 руб.
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Павелецкая набережная

Ищем Site Reliability Engineer (SRE)


Вы будете заниматься поддержкой, эволюцией и наблюдаемостью legacy-инфраструктуры на Rancher 1.6, IPsec mesh и HAProxy.


Мы ищем человека, который пишет инструменты сам, глубоко понимает сети и готов разбираться в low-level проблемах (DNS, перезагрузка балансировщиков, туннели).


Задачи:


· Поддержка и развитие инфраструктуры на Rancher 1.6 (контейнеризация, управление окружениями)

· Работа с IPsec mesh и overlay-сетями — диагностика, оптимизация, отказоустойчивость

· Настройка и тюнинг HAProxy (L4/L7) в связке с контейнерной средой

· Разработка инструментов автоматизации и наблюдаемости на Python

· Построение мониторинга на Prometheus: кастомные метрики, алерты, сбор данных с legacy-компонентов

· Troubleshooting production-инцидентов без готовых алертов

· Работа с сопутствующими сервисами: PostgreSQL, RabbitMQ

· Написание документации и runbook’ов для типовых проблем


Требования (обязательно):


· Опыт в DevOps / SRE от 4 лет

· Docker на практике — уверенная работа с контейнерами

· HAProxy или аналогичные L7/L4 балансировщики (настройка, релоады, debugging)

· Prometheus — не только базовые метрики, но и написание кастомных экспортеров/метрик

· Глубокое понимание сетей: TCP/IP, VPN (особенно IPsec), overlay, маршрутизация

· Опыт реального troubleshooting production-инцидентов

· Умение писать код на Python для автоматизации, мониторинга, вспомогательных инструментов

· Опыт работы с нестандартной / legacy инфраструктурой

· Готовность разбираться в low-level проблемах (сеть, DNS, механика перезагрузки HAProxy, Rancher 1.6)


Желательно / будет плюсом:


· Опыт с Rancher 1.x

· PostgreSQL и RabbitMQ (диагностика, мониторинг)

· Опыт построения mesh / cluster-мониторинга


Мы предлагаем:


· Реальные задачи с высокой инженерной сложностью

· Минимум бюрократии — максимум самостоятельности

· Возможность влиять на архитектуру наблюдаемости и надёжности

· Заработную плату в зависимости от уровня от 250 000 до 400 000 гросс руб.

Похожие вакансии

Менеджер по развитию нового бизнеса / New Business Manager в digital-агентство
Convergent

Тебе предстоит общаться с потенциальными партнерами и выстраивать с ними доверительный диалог. Мыслишь метриками и ценностью. Для тебя не пустой...

Менеджер по работе с ключевыми клиентами/Key Account Manager с акцентом на холодные продажи
Нетмонет

Опыт работы с enterprise-клиентами от 2 лет (важно). Опыт холодных B2B-продаж от 2 лет (очень важно).

Инженер-конструктор печатных плат
НПЦ ЭЛВИС

Высшее профильное образование. Знание современной элементной базы. Знание современных скоростных интерфейсов, анализ целостности сигналов. Опыт работы не менее 3-х...

Специалист по таможенному декларированию
Ozon

Опыт работы в сфере таможенного дела от 3 лет. Опыт работы с Решением Совета Евразийской экономической комиссии от 20 декабря...

Инженер SRE/DevOps
Bell Integrator

Область деятельности – Middleware (поддержка или развитие). Знания и практический опыт по направлениям: Kubernetes (DKP, vanilla). Apache Kafka (+ schema registry).