Команда SRE отвечает за стабильность и наблюдаемость систем. Мы внедряем SRE-практики для повышения надёжности инфраструктуры и ПО, автоматизируем мониторинг, логирование и трассировку, разрабатываем инструменты для обеспечения надежности и observability сервисов. Команда активно участвует в разборе инцидентов и валидации решений для улучшения. Наша цель - обеспечить стабильную, предсказуемую работу сервисов компании.
Чем предстоит заниматься:
- Разработкой инструментов для повышения надежности информационных систем;
- Участием в устранении сбоев и расследовании их причин;
- Повышением Observability приложений;
- Проектированием, внедрением и поддержкой метрик для мониторинга;
- Помощью продуктовым командам в организации их метрик;
- Разработкой общих библиотек и инструментов для повышения Observability;
- Внедрением стандартов и best practices и повышением инженерной культуры команд.
Что мы ожидаем:
- Умение работать с Linux на уровне системного администратора;
- Уверенное владение одним из языков программирования: Go, Python, Java и другие;
- Понимание принципов построения CI/CD-пайплайнов и IaC-подхода;
- Понимание в ИТ: сетях, работе с данными, протоколах интернета, RPC и другом;
- Опыт работы с системами контроля версий Git;
- Опыт работы с системами мониторинга Prometheus и Grafana, агрегаторами логов Splunk, ELK и Graylog;
- Опыт работы с системами контейнеризации и оркестрации Docker и k8s;
- Умение быстро принимать решения во время сбоя, не теряетесь и не сдаетесь.
Мы предлагаем:
- Работу в аккредитованной ИТ-компании;
- Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным;
- Возможность выбора формата работы (офис/гибрид/удаленно);
- Комфортный современный лофт-офис в 5 минутах от метро "Улица 1905 года";
- Оформление в соответствии с ТК РФ;
- Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.
Похожие вакансии
Постоянно развиваться, учиться, прокачивать свои знания и навыки. Будет плюсом: PHP 7.4-8.*. MySQL.
Опыт разработки хранилищ данных (DWH) и построения ETL/ELT процессов. Практический опыт работы с ClickHouse или аналитическими СУБД.
Опыт выстраивания процессов SRE в проекте с DAU > 100000 клиентов. Опыт управления командой от 5-ти человек. Опыт в работе...
опыт вывода на рынок собственных или контрактных брендов. — понимание инструментов продаж в B2B и B2C. —
Отличное знание SQL, Python. Навык оптимизации запросов. Владение архитектурой данных. Опыт работы с k8s.
