Ищем сильного разработчика с опытом работы с LLM и браузерной автоматизацией для создания MVP диалоговой AI-системы персонализированного общения.
Задача:
- Развёртывание и интеграция self-hosted LLM (LLaMA) через vLLM или аналог
- Оптимизация инференса для real-time диалоговой системы
- Реализовать backend (чат, сессии, API)
- Настроить поведение модели и prompt engineering
- Проектирование архитектуры памяти и профилей пользователей (PostgreSQL / Redis, история диалогов, профиль пользователя)
- Браузерная автоматизация через Playwright с имитацией человеческого поведения (работа с прокси, подмена fingerprint)
- Telegram-бот для операционных уведомлений
- Интеграция всех компонентов системы в единый pipeline
- Быстро фиксить проблемы по результатам тестов
Цель: запуск MVP за короткий срок, который можно тестировать в реальных диалогах
Требования:
Обязательно:
- Опыт работы с LLM (open-source модели)
- Понимание prompt engineering
- Опыт backend-разработки 3+года (Python)
- Опыт браузерной автоматизации (Playwright / Puppeteer)
- Понимание антидетект техник
- Понимание работы API, очередей, БД
- Умение быстро собирать MVP
Плюсом будет:
- Опыт с vLLM / TGI / Ollama
- Работа с LLaMA / Qwen / Mistral
- Опыт с антидетект браузерами (Dolphin Anty / AdsPower)
- Опыт с LoRA / fine-tuning
- Понимание memory систем (RAG, embeddings)
- Опыт работы с high-load чатами
Стек:
- Python (FastAPI)
- vLLM / HuggingFace
- Playwright
- PostgreSQL / Redis
- Docker
Что важно
-
Скорость > идеальность
-
Самостоятельность, задачи формулируются на уровне продукта, не технического задания
-
Участие в продуктовых обсуждениях и предложение технических решений
Условия:
- Удалённая работа
- Проектное сотрудничество (ГПХ / самозанятый / ИП)
- Быстрый старт
Похожие вакансии
Что хотим видеть: Опыт работы от 5 лет на инженерной позиции. Опыт работы в проектном институте и/или на промышленном...
Опыт: от 5 лет в должности. Знание действующей нормативной документации в сфере проектирования зданий и сооружений и пожарной безопасности.
Участие в анализе и обобщении опыта проектирования и внедрения в градостроительных решениях. Что мы ждём: Высшее профильное образование.
Опыт коммерческой разработки на Python от 6 лет. Опыт работы с FastAPI или Litestar (Starlite). Уверенное понимание async-подхода (asyncio...
Глубокое понимание сетевых протоколов (TCP/IP, TLS, HTTP/2, WebSocket, gRPC). Опыт работы с XRay-core, V2Ray, Sing...
