Просмотр вакансии

Сегодня 04-07-2026 22:56
04.07.2026, 17:35

AI / Backend Engineer

Работодатель: Postgres Professional

Postgres Professional

Город: Москва
Занятость: Полная, 5/2
Опыт работы: Более 6 лет

Ищем AI / Backend Engineer, который будет заниматься развитием продуктов: виртуального DBA (ИИ-агент, который позволяет делать автоматизированную БД и помогает с её настройкой) и корпоративного агента.

Наш стек:
Backend: Python, FastAPI, Dishka DI, FastMCP, PostgreSQL, Redis.
LLM / Inference: OpenAIcompatible APIs, vLLM, SGLang.
Observability: LangFuse, Prometheus, Sentry, Grafana.

Чем предстоит заниматься:


Разработкой backendсервисов для взаимодействия с LLM
  • разработкой CLI-агентов для кодинга;
  • реализацией механизмов работы с мультмодальными моделями на backend (например, для отправки изображений в VLM или транскрибации аудио при помощи ASR-моделей);
  • реализацией и тюнингом agent loops (ReAct,CodeAct и других);
  • разработкой и доработкой механизмов context engineering: сборкой контекста, compaction, summarization, tool masking;
  • интеграцией инструментов через MCPсерверы;
  • работой с LLM inference инфраструктурой (vLLM / SGLang);
  • реализацией streaming взаимодействия и longrunning inference;
  • развитием observability и трассировкой работы AIагентов.

Мы ожидаем:

  • уверенный опыт с асинхронным Python или любым другим backendязыком;
  • понимание возможностей и ограничений современных LLM;
  • опыт работы с OpenAI API;
  • понимание принципов context engineering;
  • навык использования AI как инструмента ускорения разработки/исследований;
  • понимание важности unit и integration тестов, роли тестов как механизма контроля качества AIсгенерированного кода;
  • опыт использования моделей для генерации и улучшения тестов;
  • инженерный подход, готовность вести полный цикл задачи;
  • опыт работы в команде, высокие коммуникативные навыки.

Будет плюсом:

  • опыт разработки agentbased AI систем;
  • опыт с infinite-loop агентами;
  • работа с selfhosted inference (vLLM, SGLang);
  • разработка MCPсерверов;
  • оптимизация latency и token usage;
  • benchmarking LLM моделей;
  • опыт разработки при помощи code agents / AIassisted development;
  • использование specdriven development;
  • умение формализовать задачу перед генерацией кода;
  • использование моделей для генерации тестов, рефакторинга и ускорения разработки.

Мы предлагаем:

Адрес: Москва, улица Обручева, 23с1

 

Откликнуться на вакансию

Дата
05.07 06.07
USD
2.9062 2.905
EUR
3.3096 3.3156
RUB
3.731 3.7314
CNY
4.2833 4.2863
CHF
3.5857 3.6082
GBP
3.85 3.8754
PLN
7.7059 7.724
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения