Data Engineer (гибрид в Москве)

Работодатель:
Зарплата:
230 000 руб.
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Чистопрудный бульвар

О компании

Мы — EvApps, IT-компания, создающая программные решения любой сложности: корпоративные порталы, облачные сервисы, мобильные приложения и информационные системы для бизнеса и государственных структур. Мы помогаем нашим клиентам быстро усиливать свои команды IT-специалистами под конкретные задачи и проекты.
Сейчас мы ищем Data Engineer (Middle+ / Senior) для разработки data lakehouse-решения под NDA для крупного заказчика в Московский офис на гибридный формат работы (3 дня в офисе, 2 на удалёнке)

Требования
  • Язык: Python (уверенное владение, понимание ООП, типизации, работы с памятью)
  • ETL/ELT: Опыт построения пайплайнов в продакшн (от 1–2 лет активной поддержки)
  • Обработка данных: PySpark / pandas / аналоги; работа с большими объёмами
  • Форматы: Parquet, columnar storage (понимание partitioning, compression, schema evolution)
  • Хранилища: S3 или аналоги (MinIO, Yandex Object Storage, etc.)
  • Архитектура: Data Lake / Lakehouse, multi-layer: raw → processed → curated
  • Data Quality: Нормализация, дедупликация, формирование golden record / master data
  • БД & SQL: PostgreSQL, Greenplum, ClickHouse (или аналоги); продвинутый SQL (оконные функции, CTE, оптимизация запросов)
  • Оркестрация: Apache Airflow (или аналоги: Dagster, Prefect, Temporal)
  • DevOps: Docker, CI/CD (GitLab CI, GitHub Actions, Jenkins), Git
  • Облака: Yandex Cloud / AWS / GCP (любая из трёх, понимание IAM, сетей, compute/storage)
  • XML: lxml, ElementTree или аналоги; опыт парсинга/валидации сложных структур


ОСНОВНЫЕ ЗАДАЧИ

  • Разработка и оптимизация ETL/ELT-пайплайнов под большие объёмы.
  • Парсинг, валидация и трансформация XML-данных.
  • Построение слоёв raw → processed → curated (Parquet + S3).
  • Реализация нормализации, дедупликации и формирования "золотых" записей.
  • Тюнинг производительности и обеспечение стабильности в продакшене.
  • Подготовка решений к переносу в закрытый контур заказчика.
  • Взаимодействие с аналитиками, архитектором, DevOps и командой

Условия:

  • проект под NDA у крупного заказчика со сроком - до конца этого года с возможностью продления;
  • современный стек и работу с Data Lakehouse-архитектурой;
  • гибридный формат работы (Москва): 3 дня в офисе, 2 дня удаленно;
  • полную занятость (40 часов в неделю);
  • конкурентную почасовую ставку;
  • стабильную загрузку без поиска проектов между контрактами;
  • сопровождение со стороны EvApps на всех этапах проекта.

Похожие вакансии

Ведущий инженер серверной инфраструктуры
Защищенные Телекоммуникации

Опыт эксплуатации и сопровождения серверной инфраструктуры промышленного масштаба от 6 лет. Опыт работы с платформами виртуализации Proxmox VE.

Ведущий серверный инженер / Системный администратор
Защищенные Телекоммуникации

Опыт эксплуатации и сопровождения серверной инфраструктуры промышленного масштаба от 6 лет. Опыт работы с платформами виртуализации Proxmox VE.

Инженер-конструктор футеровки
Лагрев

Высшее профильное образование. Опыт работы на аналогичной должности. Знание английского языка B1-B2. Преимущество: опыт проектирования огнеупорных футеровок...

Application Security Engineer / AppSec
Защищенные Телекоммуникации

Готовность к проектной деятельности (данная вакансия подразумевает проектную занятость приблизительно на полтора года). Релевантный опыт работы в отделе ИБ от...

Эксперт в дирекцию Удостоверяющий центр на проект Цифровой рубль (криптография)
БАНК УРАЛСИБ

Профильное образование или курсы переквалификации по ИБ. Знание и опыт работы с СКЗИ (КриптоПро УЦ, КриптоПро HSM, КриптоПро CSP).