Data Engineer (S3, Spark)

Работодатель:
Опыт работы:
От 1 года до 3 лет
Обязанности:
  • Разрабатывать и сопровождать ETL процессы и инженерию данных на базе Spark как основного движка обработки и загрузки данных.

  • Настраивать интеграции источников данных: подключение по JDBC к базам и стендбаям, а также стриминговые интеграции через Kafka, работу с топиками и JSON.

  • Разрабатывать и поддерживать оркестрацию процессов в Airflow (DAG’и), используя Python в связке со Spark.

  • Работать с большими объемами данных (от десятков тысяч строк до сотен миллионов и миллиардов), решать задачи оптимизации обработки.

  • Разрабатывать и обслуживать слой данных на S3 и MinIO: работа с файловой системой, компрессией, охлаждением данных, обслуживанием и пересозданием таблиц, понимание партиционирования и форматов (в т.ч. JSON).

  • Участвовать в алгоритмизации и оптимизации хранения и обработки данных в объектном хранилище (S3/MinIO) с учетом особенностей, отличных от классических реляционных СУБД вроде Greenplum.

Требования:
  • Опыт работы в области ETL и Data разработки.

  • Уверенная работа с S3, опыт работы с MinIO.

  • Опыт работы с MinIO.

  • Уверенная работа со Spark.

  • Понимание табличного формата Iceberg.

  • Опыт интеграций с Kafka, умение работать с форматом JSON.

  • Навыки разработки DAG’ов в Airflow.

  • Владение Python на уровне для написания ETL процессов и служебного кода.

  • Опыт работы с JDBC подключениями к БД и источникам данных.

  • Опыт работы с ClickHouse (в том числе в окружении Arenadata ClickHouse).

Условия:
  • Оформление по ТК РФ в ИТ-аккредитованную компанию
  • Годовой бонус до 15% от годового дохода
  • Выстроенная система работы с персоналом: индивидуальный план развития, выделенный бюджет на обучение у сторонних подрядчиков, регулярные 1:1 с руководителем
  • ДМС, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой;
  • Программа корпоративных скидок Best benefits
  • Дополнительный оплачиваемый отпуск

Похожие вакансии

Инженер-программист BMC (Linux Embedded)
Е-Флопс

Участвовать в отладке на границе железа и ПО — там, где рождается надежность серверных платформ. Разбирается в низкоуровневом программировании (ARM Cortex...

Инженер-конструктор
Бюро Крупный план

Высшее профильное образование в сфере строительства и изысканий. Опыт работы в проектировании от 2-х лет. Опыт работы в Revit...

Инженер-проектировщик
РБС ГРУПП

У Вас высшее образование в области инженерии, архитектуры или строительства. Опыт работы инженером-проектировщиком от 3 лет. Обязателен опыт работы...

Ведущий инженер-эколог
Инжиниринговая Компания Девон

Образование высшее (техническое). Знание профильной нормативной технической документации. Опыт работы по направлению не менее 3 лет. Знание и умение ведения...

Сервисный инженер
Линукс Групп

Знание LINUX обязательно. Опыт работы с серверным оборудованием и ПАК от 2–3 лет Преимущественно с HP / Dell / Cisco / Huawei.

150 000 - 180 000 руб.