Просмотр вакансии

Сегодня 05-07-2026 18:10
22.06.2026, 11:18

Senior Python Backend Developer, AI Agents Platform (MWS AI)

Работодатель: МТС

МТС

Город: Москва
Занятость: Полная, 5/2
Опыт работы: Более 6 лет

MTS AI – это отдельная компания внутри экосистемы МТС. У нас царит атмосфера стартапа, новые продукты, никакого легаси, небольшие команды, с дружественной атмосферой.

Мы разрабатываем AI-решения и продукты, используя технологии обработки и синтеза естественного языка, компьютерного зрения и edge computing. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и международными экспертами, проводим исследования, инвестируем в перспективные проекты и команды.

О продукте

Мы строим отказоустойчивую масштабируемую облачную платформу для создания и эксплуатации диалоговых AI-ассистентов: no-code конструктор агентов, оркестрация диалога, RAG, AutoML/MLOps и многоканальная доставка сообщений. Самих ботов и агентов под конкретного заказчика мы не пишем: мы делаем движок и инфраструктуру, на которых их собирают и гоняют в проде.

Сейчас к нам в команду мы ищем эксперта разработки, который возьмёт на себя самые критичные и нагруженные части платформы. Нам важен не только сильный инженер, но и человек, кому интересно, как индустрия агентов взрослеет на глазах: от prompt- к context engineering, от одиночного бота к мульти-агентным системам, MCP и A2A как новые стандарты, память и eval агентов, reasoning-модели, эффективный serving (vLLM/SGLang). Вы это не просто читаете в ленте,а пробуете руками.

Над чем будете работать

  • оркестратор диалога на LangGraph (граф сценариев, чекпоинтинг состояния, tool-calling, интеграция с LLM). Это сердце платформы и одна из самых нагруженных её частей

  • планирование и выполнение многошаговых задач, субагенты и мульти-агентная оркестрация

  • развитие долговременной памяти агентов, изолированные сэндбоксы для исполнения кода и инструментов, guardrails и контроль действий

  • парсинг и чанкинг документов, индексация и гибридный/семантический поиск в Milvus

  • рантайм диалога на Kafka: обработка входящих сообщений, маршрутизация ответов в каналы, поток событий диалога в аналитику

  • оценка качества агентов, наблюдаемость

Чем предстоит заниматься

  • реализовывать высоконагруженные бэкенды критичной бизнес-логики

  • быть владельцем кода одного или нескольких сервисов и отвечать за его качество, производительность, отказоустойчивость и документированность.

  • прототипировать и исследовать подходы (новые модели, фреймворки агентов, способы инференса), чтобы обоснованно выбирать решения, а не следовать хайпу

  • по желанию и в перспективе расти в техлида или тимлида продукта

Мы ожидаем от вас

  • релевантный опыт backend-разработки от 5 лет с Python как основным языком на экспертном уровне (у нас 3.12): понимаете не только как писать, но и как и почему оно работает под капотом

  • глубокое понимание async-модели: где asyncio даёт выигрыш, а где только добавляет сложности, как не положить event loop блокирующим вызовом и как дебажить асинхронный код под нагрузкой; опыт с async-фреймворком (у нас FastAPI)

  • опыт проектирования и эксплуатации высоконагруженных и отказоустойчивых сервисов (нагрузка, конкурентность, backpressure, деградация, идемпотентность)

  • уверенная работа с микросервисами и брокерами сообщений (у нас Kafka)

  • опыт с реляционными БД (у нас PostgreSQL); понимание, чем платить за консистентность и как не положить базу под нагрузкой

  • алгоритмы и структуры данных, ООП, SOLID, чистый читаемый код, code review, юнит-тесты

  • devOps-культура: CI/CD,gitlab, docker, kubernetes, консоль

  • интерес к домену агентов и актуальным ии-экосистемам: вы следите за тем, что появляется (LangChain/LangGraph, RAG, function/tool-calling, MCP, векторные БД, инференс LLM), и имеете аргументированное мнение, что из этого применимо у нас

  • английский на уровне чтения и написания технической документации (B1+)

Будет плюсом

  • практический опыт с LangGraph/LangChain или другими агентными фреймворками

  • опыт построения RAG-систем и работы с векторными БД (Milvus, Qdrant, pgvector и т. п..

  • опыт serving ML-моделей (Triton Inference Server, KServe, vLLM) и работа с CUDA/GPU

  • понимание пайплайнов ML и актуальных проблем NLP

  • опыт с ClickHouse, Redis, S3/MinIO, gRPC

  • бэкенд на других языках (Go, C++, Rust, Java/Kotlin и пр.); у нас адаптеры на Go

  • опыт с любыми чат-бот/агент-платформами или разработка собственных ботов и агентов

  • опыт удалённой работы в распределённой команде

Наш стек

  • Python 3.12, FastAPI, asyncio; LangGraph и LangChain 1.0, MCP (langchain-mcp-adapters),

  • LiteLLM, OpenAI-совместимые API для LLM. Инференс и ML: эмбеддинги на Triton (GPU, PyTorch),

  • serving моделей на KServe, AutoML-пайплайны. Данные и шина: Kafka, PostgreSQL, ClickHouse,

  • адаптеры, шлюзы на Go 1.25, fiber, gRPC, franz-go

  • Milvus, Redis, S3/MinIO, Clickhouse

  • Kubernetes, Helm, GitLab CI, OpenTelemetry и Prometheus

Что мы предлагаем:

  • атмосфера IT-стартапа и участие в инновационных проектах в области AI;

  • работу в сильной команде, уровень разработчиков в компании — middle+/senior и актуальный стек технологий;

  • действительно гибкий график, у нас нет обязательных дней в офисе и начала рабочего времени, команда встречается в офисе по договоренности, возможен полностью удаленный формат по РФ;

  • новый современный офис на метро Курская, если тебе все же нравится видеться иногда с коллегами;

  • программа ДМС с полным покрытием с первой недели работы, включая стоматологию и услуги телемедицины, полис для выезжающих за рубеж, страхование жизни;

  • участие в конференциях и митапах, обучение за счет компании.

Адрес: Москва, Подсосенский переулок, 23с5

 

Откликнуться на вакансию

Дата
05.07 06.07
USD
2.9062 2.905
EUR
3.3096 3.3156
RUB
3.731 3.7314
CNY
4.2833 4.2863
CHF
3.5857 3.6082
GBP
3.85 3.8754
PLN
7.7059 7.724
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения