Работодатель:
Опыт работы:
От 1 года до 3 лет
Место работы:
Москва, Большая кольцевая линия, метро Петровский парк

Мы планируем построить и внедрить локальные LLM-решения для автоматизации внутренних бизнес-процессов. Наша цель — обеспечить высокий уровень безопасности данных, контролируемость инфраструктуры и независимость от внешних облачных провайдеров, где это критично. Мы ищем инженера, который сможет спроектировать архитектуру, настроить пайплайны и вывести модели в промышленную эксплуатацию в корпоративном контуре.

Обязанности:

  • Архитектура и разработка: Проектирование и разработка корпоративной LLM-платформы с фокусом на локальное развертывание (on-premise) и использование open-source моделей;

  • Интеграция фреймворков: Построение пайплайнов обработки данных и оркестрации запросов с использованием Open WebUI, LiteLLM, Langflow и RAGFlow для создания RAG-приложений и агентных рабочих процессов;

  • Инфраструктура и инференс: Настройка высокопроизводительного инференса моделей с использованием vLLM для обеспечения низкой задержки и эффективного использования GPU-ресурсов;

  • Унификация доступа: Настройка единого шлюза для управления подключениями к различным LLM (как локальным, так и внешним через OpenRouter) для гибкости и резервирования;

  • Интеграция и автоматизация: Встраивание ML-решений во внутренние системы компании (CRM, HRM, документооборот) и автоматизация рутинных задач сотрудников;

  • MLOps/LLMOps: Внедрение практик мониторинга, версионирования промптов и моделей, а также CI/CD для ML-компонентов.

Требования:
  • От 2-х лет коммерческого опыта в разработке и внедрении ML/AI решений;

  • Стек технологий (Core):

  1. Глубокое знание и опыт работы с указанным стеком: Open WebUI (как интерфейс для взаимодействия с моделями);

  2. LiteLLM (прокси-сервер для унификации API), Langflow или LangChain (оркестрация цепочек), RAGFlow (реализация RAG-пайплайнов);

  3. Опыт оптимизации инференса моделей с использованием vLLM или аналогичных библиотек (TensorRT, ONNX);

  4. Знание OpenRouter как агрегатора API-провайдеров.

  • Разработка: Продвинутый уровень Python (асинхронное программирование, FastAPI);

  • Базы данных: Опыт работы с векторными базами данных (Pinecone, Milvus, Qdrant, FAISS);

  • Инфраструктура: Опыт контейнеризации и оркестрации (Docker и тп), понимание принципов работы GPU в кластере.

Будет плюсом:

  • Опыт работы с локальными open-source моделями (Llama, Qwen, Deepseek);
  • Опыт интеграции AI в корпоративные системы (1С, SAP, Jira, Confluence, Битрикс24 и тп);
  • Знание MLOps практик (MLflow, Weights & Biases);
  • Опыт построения систем с учетом требований информационной безопасности и соблюдения локального законодательства (152-ФЗ) — использование локальной инфраструктуры для обработки персональных данных.

Личные качества (Soft Skills):

  • Системное мышление и способность видеть продукт целиком, а не только ML-модель;
  • Коммуникабельность: умение объяснять технические решения бизнес-заказчикам и стейкхолдерам;
  • Проактивность: готовность предлагать архитектурные решения и брать ответственность за их реализацию;
  • Стремление к изучению нового: быстро меняющийся стек LLM требует постоянного самообучения.
Условия:
  • Интересные задачи и проекты;
  • Оформление по ТК РФ;
  • Официальная заработная плата (уровень оплаты труда, обсуждается с успешным кандидатом на собеседовании);
  • График работы 5/2 пн-чт с 09.30 до 18.15, пятница с 09.30 до 17.00;
  • Возможность гибридного или удаленного формата работы.

Похожие вакансии

ML-инженер (Middle)
Riverstart (ООО Риверстарт)

Опыт коммерческой ML-разработки или эквивалентная сложность петпроектов от 2 лет. Профильное высшее образование с математическим, физико-математическим или IT...

ML Engineer / Machine Learning Developer
Платформа Проще

Опыт коммерческой ML-разработки от 3 лет. Опыт работы с табличными данными и построением ML-моделей. Опыт разработки production ML...

250 000 руб.
ML-инженер
POSCREDIT

Python — уверенное владение, ООП, чистый и читаемый код. FastAPI — разработка REST-сервисов. Системы версионирования — GitLab. Опыт закрытия проекта целиком — от...

ML engineer (invest tech)
ВИМ Инвестиции

Не менее 5-и лет опыта в роли MLE / DS. Не менее 3-х лет опыта работы с LLM / ML...

Специалист по компьютерному зрению и ИИ (CV/ML Engineer)
CareMyBaby

Подтверждённый опыт разработки в области компьютерного зрения от 2 лет, подтверждённый реализованными проектами (портфолио, ссылки на репозитории, описание внедрённых решений...