Старший инженер мониторинга

Работодатель:
Опыт работы:
От 1 года до 3 лет
Место работы:
Москва, Северный административный округ, Хорошёвский район

Мы занимаемся разработкой и сопровождением высоконагруженных информационных систем. Объединяем инновации, современные технологии и экспертов для создания масштабных технологических решений для государственного сектора и крупного бизнеса.

Наши решения позволяют работать с большими объёмами данных, быстро получать информацию, автоматизировать принятие управленческих решений и осуществлять опережающее управление на основе данных.

Ищем Старшего инженера мониторинга в отдел эксплуатации и сопровождения витрин данных

Задачи:

  • Диагностика и разрешение производственных инцидентов.
  • Оптимизация производительности систем.
  • Администрирование баз данных (PostgreSQL, ClickHouse).
  • Разработка и поддержка runbooks и документации.
  • Наставничество junior engineers.
  • Написание root cause analysis (RCA) инцидентов.

Что мы ждем от кандидата:

  • Опыт работы на позиции старшего инженера / SRE-инженера от 1 года или на позиции дежурного инженера 2 и более лет.
  • Готовность к коммуникациям в MAX (это наш корпоративный мессенджер).
  • Готовность к участию в on-call ротации дежурств.

Технические навыки, которые нам важны:

1. Внутреннее устройство Linux/Unix:

  • TCP/IP сеть (понимание как работает SYN flood, что такое TIME_WAIT).
  • Управление процессами (zombie processes, D-state и т.д.).
  • I/O подсистема (iostat, page cache, buffer management).
  • Файловые системы и параметры монтирования.
  • Tuning параметров ядра (sysctl).

2. Администрирование баз данных:

  • PostgreSQL: Patroni, replication, troubleshooting.
  • EXPLAIN ANALYZE, оптимизация запросов.
  • Анализ блокировок, разрешение deadlock'ов.
  • WAL management, backup/restore.
  • ClickHouse: дизайн схемы, TTL, merges.
  • System-таблицы для диагностики.
  • Анализ медленных запросов.

3. Observability Stack:

  • VictoriaMetrics + PromQL (написание queries для диагностики).
  • Дизайн Grafana дашбордов.
  • Логирование (OpenSearch, Fluent Bit).
  • Distributed tracing (опционально, но желательно: Jaeger).

Будет плюсом:

- Понимание Infrastructure as Code.

- Ansible playbooks для процедур восстановления.

- Опыт управление инцидентами (Написание RCA (clear, actionable), Root cause vs symptom analysis, Blameless postmortems, Оценка уровня серьезности).

Что предлагаем:

  • Формат работы: на время испытательного срока - офис (полный день), после - гибридный формат (3 дня офис, 2 дня удалённо).
  • Комфортное рабочее место в современном и стильном офисе в пешей доступности от метро Зорге.
  • ДМС со стоматологией после испытательного срока.
  • Компенсация спорта.
  • Корпоративный университет и библиотеки.
  • Скидки на домашний интернет и мобильную связь «Т2».
  • Конкурентный уровень дохода (обсуждается на этапе собеседования).

Похожие вакансии

Инженер по информационной безопасности - динамический анализ (ОС Astra Linux)
Группа компаний Астра

Навыки администрирования Linux. Понимание принципов работы Linux (процессы, память, файловые системы, системные вызовы). Умение читать и понимать исходный код на...

Senior Java Developer в WB Банк
RWB (Wildberries & Russ)

Имеете опыт коммерческой разработки на Java/Kotlin от 3-х лет. Имеете опыт работы с PostgreSQL. Имеете опыт с высоконагруженными...

Сетевой инженер IT
Plus Development

Практический опыт проектирования и внедрения локальных вычислительных сетей класса Enterprise на базе оборудования MikroTik. Опыт работы с решениями по сетевой...

WEB аналитик (Senior) в службу бизнес-аналитики и планирования ВТБ Онлайн
Банк ВТБ (ПАО)

Опыт работы от 3-х лет на позиции веб-аналитика в компаниях с высоким трафиком (e-commerce, финтех, банки) обязателен.

Старший бухгалтер
La Fabrique

Высшее профильное образование (бухгалтерия, финансы, экономика). Опыт работы старшим/ведущим бухгалтером или заместителем главного бухгалтера от 3 лет.

130 000 - 150 000 руб.