Data Engineer

Работодатель:

Опыт работы:

От 1 года до 3 лет

Место работы:

Москва, Огородный проезд, 16/1с5

На проект по разработке хранилища данных и Data Lake требуется квалифицированный дата-инженер. Одной из составляющих является система self-service аналитики с достаточно большой степенью детализации, что потребует усилий по оптимизации загрузок и чтения данных. В перспективе рассматривается масштабирование за счет облачных ресурсов.

Чем предстоит заниматься:

Участие в формировании и согласование архитектуры системы обработки и обмена данными
Выбор и тестирование различных инструментов для повышения качества и скорости обработки данных
Разработка процедур сбора данных из различных источников (файлы, базы данных, очереди, веб-сервисы, API)
Разработка процессов загрузки и трансформации данных в хранилище
Разработка процедур обновления витрин
Настройка и поддержка оркестрации процессов, алертинг результатов выполнения процессов.
Разработка процессов сбора метрик качества данных.
Разработка интеграционных процессов с внешними системами.
Оптимизация производительности загрузки и чтения данных
Разработка кубов для Self-service аналитики

Стек:

Транспорт: Debezium, Kafka

Базы данных: PostgreSQL, Greenplum, Clickhouse

Транформации данных: SQL/pgSQL, Python,

Оркестрация: Airflow,

BI: PowerBI (DAX), Superset

Управление разработкой: Jira, GitLab

Наши ожидания:

Высшее образование
Опыт работы ETL-разработчиком, дата инженером от 1-го года
Практический опыт работы с реляционными СУБД в рамках промышленной эксплуатации (как минимум одна из: Oracle, MS SQL, PostgreSQL)
Отличное знание SQL (запросы, оптимизация запросов, анализ производительности запросов, преобразование данных, работы с аналитическими функциями)
Наличие опыта разработки ETL-процессов, настройки пайплайнов, навыки оптимизации скорости загрузки
Наличие опыта работы с Airflow или другим оркестратором процессов.
Знание общих принципов организации процесса разработки, тестирования и сопровождения ПО (DevOps), опыт работы с Git
Желательно наличие опыта работы с Clickhouse
Знание методологий и принципов разработки хранилищ: Kimball, Data Vault, слои данных.

Мы предлагаем:

Официальное оформление по ТК РФ
Формат работы: удаленный
График 5/2
ДМС со стоматологией, компенсация фитнеса, образовательные курсы и семинары
Развитая корпоративная культура и дружелюбный коллектив
Ежедневное погружение в мир книг и неограниченный доступ ко всем электронным и аудиокнигам

Просьба в сопроводительном письме указывать желаемый уровень дохода.

Data Engineer

Похожие вакансии

Популярные профессии