Город: Москва
Занятость: Проект, 5/2
Опыт работы: От 3 до 6 лет
О проекте
Локальная мультиагентная платформа для анализа бизнеспроцессов на основе LLM. Платформа развёртывается в инфраструктуре заказчика (onpremise), интегрируется с корпоративными системами и масштабируется на новые бизнесслучаи.
Наша задача — создать надёжную, управляемую и защищённую AIплатформу, готовую к промышленной эксплуатации.
Кого мы ищем
Опытного инженера LLM / SRE, который сможет сочетать навыки backendразработки, работы с LLM и эксплуатации.
Вы будете отвечать за разработку мультиагентных сценариев, развёртывание локальных моделей, интеграции и обеспечение стабильной работы платформы.
Ключевые обязанности
- Разработка, развёртывание и сопровождение мультиагентной архитектуры (агенты, маршрутизация, RAGконвейеры).
- Проектирование и оптимизация промптов, систем контроля качества генерации и agentflows.
- Развёртывание локальных LLM, управление версиями моделей и оптимизация inference.
- Интеграция с корпоративными системами через REST/API, обеспечение безопасности передач данных.
- Настройка CI/CD процессов для микросервисов (Docker, GitLab CI/GitHub Actions), автоматизация развёртываний и откатов.
- Настройка мониторинга, логирования и алертинга (Prometheus, Grafana, Loki/ELK), сбор метрик качества генерации.
- Участие в инцидентменеджменте, root cause analysis и повышении надёжности (SREвзаимодействия).
- Подготовка документации, обучение внутренних команд и поддержка code review.
Требования (обязательные)
- Python 3.10+ — уверенная разработка сервисов, знание async/await, практический опыт написания тестов.
- Практический опыт работы с LLM / Generative AI: PoC или productionпроекты, ежедневное использование моделей в инженерной деятельности.
- Опыт построения RAGpipeline и работы с фреймворками вроде LangChain / LlamaIndex / LangGraph.
- Опыт развёртывания серверных приложений в Linuxокружении.
- Уверенное владение Docker и Docker Compose; базовые навыки оркестрации (Kubernetes).
- Опыт интеграции через REST API, умение работать с корпоративными системами.
- Готовность к работе onpremise / гибридно; технический английский для чтения документации.
Желательные навыки (будут преимуществом)
- Опыт эксплуатации AIинфраструктуры: управление моделями, настройка inference на CPU/GPU, оптимизация latency.
- Опыт работы с векторными базами (Qdrant, Milvus, pgvector).
- Навыки SRE/DevOps: Prometheus, Grafana, Loki/ELK, GitLab CI/GitHub Actions на productionуровне.
- Опыт работы с Yandex Cloud / Yandex AI Studio.
- Опыт PostgreSQL, Redis, SQL.
- Опыт в MLOps и управлении MLpipelines.
Опыт
- Коммерческий опыт разработки: от 2 лет (или эквивалентные проекты/портфолио).
- Практический опыт с LLM/GenAI: от 1 года (PoC или production).
- Docker/Linux/развёртывание серверных приложений: от 1 года.
Примеры реальных задач
- Свернуть RAGpipeline по корпоративной документации, снизив latency и сохранив точность поиска.
- Настроить CI/CD процесс для обновления локальной модели с автоматическим откатом при регрессе.
- Построить метрики качества генерации и интегрировать мониторинг с алертами при деградации.
Soft skills и культура
- Умение формализовать требования и коммуницировать с заказчиком.
- Самостоятельность, ответственность за участок платформы, умение приоритизировать задачи.
- Готовность к командной работе в кроссфункциональной команде инженеров и MLresearch.
Условия работы
- Формат: onpremise / гибрид (точный режим обсуждается на собеседовании).
- Проектная занятость (+/-6 месяцев).
- Команда: компактная команда инженеров и MLresearch.
- Конкурентная оплата.
Как откликнуться
В сопроводительном письме, пожалуйста, опишите кратко один проект с LLM: цель, стек, ваша роль, результат (включая метрики, если есть).
Адрес: Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 42с1
Похожие вакансии