Город: Москва
Занятость: Полная, 5/2
Опыт работы: Более 6 лет
Ищем AI / Backend Engineer, который будет заниматься развитием продуктов: виртуального DBA (ИИ-агент, который позволяет делать автоматизированную БД и помогает с её настройкой) и корпоративного агента.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAIcompatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAIcompatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.
Чем предстоит заниматься:
Разработкой backendсервисов для взаимодействия с LLM
- разработкой CLI-агентов для кодинга;
- реализацией механизмов работы с мультмодальными моделями на backend (например, для отправки изображений в VLM или транскрибации аудио при помощи ASR-моделей);
- реализацией и тюнингом agent loops (ReAct,CodeAct и других);
- разработкой и доработкой механизмов context engineering: сборкой контекста, compaction, summarization, tool masking;
- интеграцией инструментов через MCPсерверы;
- работой с LLM inference инфраструктурой (vLLM / SGLang);
- реализацией streaming взаимодействия и longrunning inference;
- развитием observability и трассировкой работы AIагентов.
Мы ожидаем:
- уверенный опыт с асинхронным Python или любым другим backendязыком;
- понимание возможностей и ограничений современных LLM;
- опыт работы с OpenAI API;
- понимание принципов context engineering;
- навык использования AI как инструмента ускорения разработки/исследований;
- понимание важности unit и integration тестов, роли тестов как механизма контроля качества AIсгенерированного кода;
- опыт использования моделей для генерации и улучшения тестов;
- инженерный подход, готовность вести полный цикл задачи;
- опыт работы в команде, высокие коммуникативные навыки.
Будет плюсом:
- опыт разработки agentbased AI систем;
- опыт с infinite-loop агентами;
- работа с selfhosted inference (vLLM, SGLang);
- разработка MCPсерверов;
- оптимизация latency и token usage;
- benchmarking LLM моделей;
- опыт разработки при помощи code agents / AIassisted development;
- использование specdriven development;
- умение формализовать задачу перед генерацией кода;
- использование моделей для генерации тестов, рефакторинга и ускорения разработки.
Мы предлагаем:
Адрес: Москва, улица Обручева, 23с1
Похожие вакансии