Хотите стать частью увлекательного процесса цифровой трансформации?
Блок IT в СОГАЗ активно развивается и меняет подход к созданию продуктов. Мы создаем новые сервисы и решения, которые делают нашу работу более технологичной и эффективной.
Обязанности:
-
Разработка и развитие пайплайна автоматической обработки документов: от PDF-сканов до структурированных данных в XML;
-
Определение типа документа и извлечение нужных полей из печатного и рукописного текста;
-
Организация процесса разметки данных (Label Studio);
-
Подбор и интеграция open-source OCR-движков с учётом баланса скорость/качество под разные типы документов;
-
Обучение и дообучение ML-моделей под специфику документооборота компании на размеченных данных;
-
Обеспечение требуемой скорости и качества обработки для production-нагрузки;
-
Построение системы валидации извлечённых данных и мониторинга качества работы моделей;
-
Быстрое добавление новых типов документов в работающую систему без переделки всего пайплайна.
Требования:
- Опыт построения production-пайплайнов на основе ML/DL моделей: от прототипа до промышленной эксплуатации;
- Уверенное владение Python и современным стеком машинного обучения (PyTorch, HuggingFace);
- Практический опыт работы с задачами компьютерного зрения и обработки естественного языка, в идеале - с документами (OCR, классификация, извлечение сущностей);
- Опыт дообучения моделей под конкретный домен и понимание методов оценки качества;
- Умение выбирать инструмент под задачу: где достаточно специализированной модели, а где оправдано применение более тяжёлых решений;
- Понимание ограничений LLM/VLM и принципов построения надёжных систем извлечения данных.
Технологический стек: Python, PyTorch, HuggingFace Transformers, OpenCV, BERT / LiLT / LayoutLM, DiT и vision-трансформеры, PaddleOCR, VLM-OCR (PaddleOCR-VL, dots.ocr, Qwen-VL), PEFT (LoRA, QLoRA), vLLM, Triton Inference Server, ONNX, Docker, Label Studio.
Условия:- Оформление полностью в соответствии с ТК РФ, включая оплачиваемый отпуск 29 календарных дней (плюс 1 день отпуска);
-
ДМС в лучших клиниках города, страхование жизни и страхование от несчастных случаев и болезней + ДМС родственников с 75% скидкой;
- Премиальные условия на всю продуктовую линейку группы компаний «СОГАЗ» для работников и их близких родственников (ОСАГО, каско, имущество, жизнь);
- Социальный пакет и специальные предложения по страхованию, кредитованию и другие программы от наших партнёров;
- Профессиональное развитие: курсы, тренинги, корпоративная библиотека;
- Заботу компании о детях сотрудников: подарки на Новый год и скидки в детские лагеря.
Похожие вакансии
Имеете опыт тестирования web-ресурсов (frontend & backend) от 1 года. Умеете писать мобильные автотесты на Appium (Android/iOS).
Опыт в агентстве (обязательно): вы понимаете специфику работы с несколькими внешними заказчиками, привыкли к многозадачности и соблюдению жестких дедлайнов.
Опыт файнтюнинга open-source LLM (Llama 3, Qwen, DeepSeek Coder) под задачи Domain-specific language (1С/ABAP/SAP BTP).
Релевантный опыт работы от двух лет. Уверенное владение SQL (MySQL) и Python. Опыт работы с Airflow, понимание принципов CI/CD...
Имеешь опыт коммерческой разработки на Go от 4 лет. Имеешь опыт работы с инфраструктурой микросервисов (Docker/Kubernetes) и механизмами обмена...
