Мы — международный product-стартап в сфере AI-генерации контента. Наши продукты — Telegram Mini Apps и веб-платформы с высокой нагрузкой (десятки тысяч пользователей, real-time взаимодействие, генерация видео и изображений через AI).
Работаем в высококонкурентных digital-вертикалях, где требования к стабильности инфраструктуры, безопасности и скорости доставки значительно выше среднего.
Сейчас ищем DevOps-инженера, который уже сталкивался с high-risk/highload продуктами и понимает специфику подобных проектов.
Чем предстоит заниматься:
Инфраструктура и оркестрация:
- Управлять контейнеризацией на Docker и оркестрацией через Docker Swarm / Kubernetes (в зависимости от проекта).
- Настраивать и поддерживать production-серверы на Linux (Ubuntu / Debian / CentOS).
- Работать с Nginx и Traefik для маршрутизации трафика, балансировки нагрузки и reverse-proxy.
CI/CD и автоматизация:
- Настраивать и поддерживать пайплайны в GitHub Actions (сборка, тестирование, деплой).
- Автоматизировать процессы развертывания и обновления сервисов.
Базы данных и очереди:
- Настраивать и оптимизировать PostgreSQL (репликация, бэкапы, мониторинг).
- Работать с Redis (кэширование, сессии, очереди, pub/sub).
Мониторинг и логирование:
- Разворачивать и настраивать Prometheus + Grafana для сбора метрик и визуализации.
- Настраивать Sentry для отслеживания ошибок.
- Централизовать логи (Loki / ELK / OpenSearch — по желанию).
Безопасность и сеть:
- Настраивать SSL-сертификаты (Let's Encrypt, платные), управлять доменами.
- Обеспечивать базовую безопасность серверов (фаерволлы, ограничение доступа, обновления).
Highload и отказоустойчивость:
- Проектировать инфраструктуру, способную выдерживать пиковые нагрузки (десятки тысяч RPS).
- Настраивать горизонтальное масштабирование, репликацию, резервное копирование.
- Проводить нагрузочное тестирование и оптимизировать узкие места.
- Поддержка production:
- Быть на связи для решения инцидентов (on-call по графику или в экстренных случаях).
- Участвовать в расследовании причин падений и write-post-mortem.
Технологический стек:
- Linux (администрирование, bash-скрипты, основы сети)
- Docker + Docker Swarm или Kubernetes (хотя бы одна из оркестраций)
- CI/CD: GitHub Actions (опыт настройки пайплайнов)
- Веб-серверы: Nginx, Traefik (настройка reverse-proxy)
- Базы данных: PostgreSQL, Redis (установка, настройка, оптимизация)
- Мониторинг и логи: Prometheus, Grafana, Sentry
- SSL / домены: Let's Encrypt, Certbot, управление DNS
Будет плюсом:
- Опыт с облачными провайдерами (AWS, GCP, DigitalOcean, Hetzner, Selectel).
- Опыт с ClickHouse (аналитика, большие данные).
- Опыт с WebSocket / real-time сервисами.
- Понимание работы AI-моделей (GPU-серверы, CUDA, драйвера Nvidia).
- Опыт с GitLab CI / GitLab Runner.
- Опыт настройки Kafka / RabbitMQ.
- Знание инфраструктуры Telegram Mini Apps (WebView, интеграции).
Мы ждём, что вы:
- Опыт коммерческой работы DevOps от 3 лет (из них минимум 2 года — поддержка production).
- Умеете поднимать инфраструктуру с нуля и поддерживать её в рабочем состоянии.
- Понимаете, как строить отказоустойчивые системы (репликация, бэкапы, балансировка).
- Знаете, как искать узкие места в highload-системах и устранять их.
- Готовы работать в стартап-среде (иногда нестандартные задачи, высокая скорость).
Что мы предлагаем:
- Заработная плата 3000 - 4000 $ (оплата в USDT)
- Полностью удалённая работа
- Возможность влиять на продукт, процессы и стратегию компании
- Работа с AI, LLM и современными технологиями
- Быстрый рост вместе с компанией
- Сильная команда и прямое взаимодействие с фаундерами
Похожие вакансии
Опыт от 5 лет в риск-аналитике, отраслевом анализе, корпоративном андеррайтинге или отраслевом консалтинге. Опыт от 2 лет в лизинге...
Хорошее знание C/C++ и линейной алгебры. Опыт работы с ПК или консольными проектами. Умение оптимизировать CPU, GPU, memory.
Опыт работы DevOps / Infrastructure Engineer от 5 лет. Опыт проектирования инфраструктуры с нуля. Уверенный опыт работы с AWS.
Стаж работы в крупной лизинговой компании или Банке в подразделении кредитного анализа клиентов сегмента «Крупный бизнес» не менее 5 лет.
Опыт проектирования и поддержки распределенных, высоконагруженных, отказоустойчивых и масштабируемых сервисов. Понимание специфики проектирования cloud‑native решений. Понимание принципов и инструментов...
