Работодатель:
Опыт работы:
Более 6 лет
Место работы:
Москва, Садовая-Кудринская улица, 1
Вам предстоит:

Data Warehouse:

  • Проектирование и построение DWH в ClickHouse с нуля: схемы, партиционирование, TTL, материализованные представления;
  • Подключение всех источников данных компании: CRM, сайт, колл-трекинг, 1С, СОД, ERP — 100% покрытие к концу Фазы 1;
  • Стандартизация форматов данных между разными системами — единая модель для аналитики и ML;
  • Управление версионированием схем базы данных, миграции без потери данных;
  • Оптимизация запросов: индексы, первичные ключи, профилирование медленных запросов.

ETL-пайплайны:

  • Разработка и поддержка ETL-пайплайнов на Python (pandas, polars) для всех 12 бизнес-блоков;
  • Оркестрация пайплайнов через Apache Airflow: расписания, зависимости, алерты при падениях;
  • Обработка ошибок, идемпотентность загрузок — данные не должны дублироваться или теряться;
  • Инкрементальная загрузка: только изменившиеся данные, без полной перезаписи;
  • Мониторинг свежести данных: алерт если данные не обновлялись дольше порога.

Парсинг и внешние источники:

  • Разработка и поддержка парсера конкурентов: ЦИАН, ДОМ.РФ, Авито — обновление цен 24/7;
  • Мониторинг новых ПД на ДОМ.РФ и Telegram-каналах строительной отрасли;
  • Сбор цен на строительные материалы с сайтов поставщиков для Департамента закупок;
  • Playwright / Scrapy для сайтов с динамическим рендерингом (SPA, JavaScript-сайты);
  • Работа с API: HH.ru, Битрикс24, Telegram Bot API, Perplexity — подключение новых источников по запросу.

Интеграции:

  • REST API интеграции с корпоративными системами: CRM, ERP, HR-система, СОД;
  • Webhooks — приём событий в реальном времени из внешних систем;
  • Разработка и документирование внутренних API для доступа к данным DWH;
  • Управление доступами к данным совместно с MLOps: RBAC на уровне таблиц и схем.

Качество данных:

  • Настройка валидации данных на входе: типы, диапазоны, обязательные поля;
  • Мониторинг аномалий в данных: выбросы, пропуски, несоответствия между источниками;
  • Документирование источников, форматов и логики трансформаций (data lineage);
  • Сверка данных между системами: BI vs БДР — расхождения должны стремиться к нулю.

Документация и процессы:

  • Документирование всех пайплайнов: источник → трансформация → назначение;
  • Runbook'и для команды: как добавить новый источник, как откатить миграцию, что делать при инциденте;
  • Участие в техническом планировании совместно с ML Engineer: какие данные нужны для модели и в каком формате.
Наши ожидания:
  • ClickHouse — продакшн опыт: проектирование схем, оптимизация запросов, партиционирование;
  • Python ETL — pandas, polars: трансформации, очистка, дедупликация данных;
  • Apache Airflow — реальный опыт в проде: DAG'и, операторы, мониторинг задач;
  • SQL продвинутый — оконные функции, CTE, аналитические запросы, оптимизация;
  • REST API интеграции — подключение внешних систем, обработка авторизации (OAuth2, API Key);
  • Scrapy / Playwright — парсинг сайтов, в том числе с динамическим рендерингом;
  • Понимание моделей данных: звезда, снежинка, Data Vault — когда что применять;
  • Linux — администрирование, cron, работа с файловой системой и сетью;
  • Понимание моделей данных: когда нужна нормализация, когда денормализация под аналитику;
  • Понимание 152-ФЗ — какие данные являются ПДн, что нельзя передавать во внешние сервисы;
  • Скорость: ad-hoc аналитический запрос + вывод за 2–4 часа — критично для бизнес-блоков.

Дополнительно:

  • Kafka / RabbitMQ — потоковая обработка событий в реальном времени;
  • dbt — трансформации данных внутри DWH, тестирование моделей;
  • PostgreSQL — опыт как дополнение к ClickHouse для транзакционных данных;
  • Docker — контейнеризация пайплайнов для деплоя через MLOps;
  • Yandex Cloud — Object Storage, Managed ClickHouse, DataLens.

В Dogma Вас ждут:

  • Работа в крупном строительном холдинге федерального уровня;
  • Официальное оформление по ТК РФ с первого рабочего дня (стабильная белая заработная плата с выплатами 2 раза в месяц, оплата больничных листов, ежегодные отпуска);
  • График работы 5/2 с 09.00 до 18.00;
  • Корпоративная программа лояльности для сотрудников Best Benefits – скидки от партнёров;
  • Скидки для сотрудников на приобретение недвижимости компании от 4% до 7%;
  • Всё для эффективной и качественной работы: профессиональная техника, мобильный телефон и корпоративная сотовая связь;
  • Возможность обучения и развития в рамках корпоративного университета компании (тренинги, мастер-классы, онлайн-обучение);
  • Корпоративные подарки детям сотрудников к Новому году и объединяющие корпоративные мероприятия;
  • Корпоративные тренировки по волейболу и футболу;
  • Безграничные возможности кросс-функционального взаимодействия и участия в крупных проектах для расширения профессиональной экспертизы;
  • Отличная команда профессионалов с комфортной и дружелюбной рабочей атмосферой.

Похожие вакансии

Главный экономист
СУЭК, Сибирская Угольная Энергетическая Компания

Высшее экономическое образование. Опыт работы экономистом, финансовым контролером в угольной или другой добывающей отрасли. Отличное знание производственной экономики.

Инженер-строитель (общестрой)
SAWATZKY

Знание специфики основных типов строительных работ. Высшее строительное образование. Желателен опыт работы с проектной и технической документацией. Знание техники безопасности...

175 000 - 175 000 руб.
Qa-инженер
Бэнкс Софт Системс

Опыт проведения функционального, интеграционного и регрессионного тестирования. Опыт тестирования АБС ЦФТ. Опыт работы с БД: CRUD операции, джойны.

Инженер по вентиляции и кондиционированию
НИОПИК

Высшее техническое образование. Опыт работы в области обслуживания систем вентиляции не менее 3 лет. Понимание и практический опыт работы с...

Старший директор группы супермаркетов
Перекрёсток

Опыт управления магазином (не ниже формата супермаркет), либо группой магазинов, от 1 года. Навыки управления изменениями и реализации проектов улучшений.

150 000 руб.