AI Engineer – RAG / Knowledge Graph / Local LLM

Работодатель:
Зарплата:
180 000 - 250 000 руб.
Опыт работы:
От 3 до 6 лет
Место работы:
Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 42с1

О нас

LumosIT - пять лет на рынке IT-разработки для бизнеса, резидент Технопарка Сколково, резидент Московского Инновационного Кластера, патенты на изобретения в области передовых методов AI.

Строим корпоративные AI-системы для B2B: от строительства и производства до банков и логистики. Ядро нового продукта - интеллектуальные базы знаний, которые отвечают на основе внутренней документации компании без галлюцинаций и с трассировкой до источника. Заказов становится больше, проекты идут параллельно, поэтому расширяем команду инженером, для которого RAG это основная специализация.

Чем предстоит заниматься

  • Проектировать и строить RAG-пайплайны под нестандартные источники: транскрипты, живая речь, методологические материалы

  • Строить Knowledge Graph поверх векторной базы - типология связей, смысловые цепочки, интеграция с retrieval в лучших традициях Карпати

  • Разворачивать LLM семейства Qwen локально, настраивать OpenAI-совместимый API поверх

  • Работать с Qdrant: payload-фильтрация, гибридный поиск, мультиарендная архитектура

Задачи повторяются от проекта к проекту, устойчивый поток работы.

Требования

Опыт в Python и ML от 5-6 лет. С RAG-системами от 2-3 лет - с того момента, когда это стало актуальной инженерной задачей.

  • Гибридный поиск (dense + sparse/BM25) - строил, понимаешь ограничения семантики

  • Qdrant или аналог (Weaviate, Milvus) - работал в продакшне, не на пет-проектах

  • Knowledge Graph - ребра с типологией, граф-обход, связка с векторным поиском

  • Локальный деплой: llama.cpp, vLLM или Ollama, квантизация, CUDA

  • LangGraph или LangChain - многошаговые агенты с состоянием, обработка ошибок, retry

  • Русскоязычные данные - знаешь специфику токенизации, умеешь выбирать embedding-модель под задачу

Стек: Python 3.10+, FastAPI, asyncio · LangGraph · Qdrant + pgvector · PostgreSQL / SQLAlchemy async · sentence-transformers, multilingual-e5-large · NetworkX · llama.cpp / vLLM · Docker, Linux · Git

Плюсом: опыт с RAGAS / DeepEval, Neo4j, неструктурированными источниками, LoRA fine-tuning на RU-данных.

Условия

Работа удаленная. При желании - рабочее место в Технопарке Сколково.

Работа напрямую с основателем компании без лишних звеньев.

Договор с самозанятым или ИП. Оформление по ТК обсуждается.

Зарплата: 180 000 - 260 000 руб., финальная цифра по итогам разговора.

Вводный период 1-2 недели, оплачивается. Небольшое тестовое задание на 1-2 часа на этапе отбора.

Похожие вакансии

Специалист холодильного оборудования и вентиляции (сервисный инженер/техник) ОВиК
ВИСИЭС ГИДРО

Требования к образованию и опыту работы: Технический склад ума и умение работать с оборудованием. Позитивный настрой и готовность работать в...

Разработчик-исследователь AI/LLM
Газпромбанк

Высшее тех. образование (IT, DS, математика). 2+ года опыта в Data Science/ML. Практический опыт встраивания LLM-моделей в...

Data Engineer
Агропромцифра

Опыт разработки ETL/ELT от 3 лет (Middle) / 5+ лет (Senior), причём именно самостоятельного кода, а не настройки out...

Инженер-программист на С/С++ для ВПО (Linux)
Т8

Образование высшее техническое. Опыт разработки ПО для встраиваемых систем на C и C++. Опыт разработки ПО для микроконтроллеров с использованием...

Ведущий DevOps инженер
ИТ-Экспертиза

Глубокое понимание принципов работы операционных систем семейства Linux (systemd/initramfs и т.д). Опыт работы с Gitlab-CI, Docker, Grafana...