Просмотр вакансии

Дата-сайентист

Сегодня 30-06-2026 21:53

30.06.2026, 18:24

MLразработчик (Middle, Inference & MLOps)

Город: Москва
Зарплата: от 200000 RUR
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет

Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных инженерных решений.

Чем предстоит заниматься:

Приводить код DS к продакшенкачеству: выполнять рефакторинг, выстраивать структуру проекта, писать тесты, настраивать логирование;
Конвертировать и компилировать модели в ONNX, TensorRT и RKNN; настраивать рантаймы под разные типы оборудования (CPU, GPU, edgeустройства);
Оптимизировать инференс: проводить профилирование, устранять узкие места (ботлнеки), добавлять кастомные операции;
Использовать Triton Inference Server для деплоя и оркестрации моделей: настраивать конфигурации и маршрутизацию запросов;
Разрабатывать и поддерживать сервисыобвязки для инференса моделей;
Проводить нагрузочное тестирование сервисов инференса, выявлять узкие места и оптимизировать производительность;
Совместно с DevOps развёртывать модели: обеспечивать контейнеризацию (Docker), реализовывать базовый CI/CD;
Настраивать мониторинг и алертинг для моделей и сопутствующих сервисов: отслеживать метрики производительности, ошибок и деградации качества;
Развивать и настраивать внутреннюю MLOpsплатформу (ClearML): вести трекинг экспериментов, версионировать датасеты и модели, настраивать пайплайны.

Мы ожидаем:

Не менее 3 лет коммерческой разработки на Python; сформированную культуру разработки — в том числе навыки тестирования, логирования, типизации, соблюдения принципов чистого кода и выстраивания понятной структуры проектов;
Опыт работы с фреймворками машинного обучения (преимущественно PyTorch);
Понимание особенностей инференса моделей в продакшене: таких параметров, как latency и throughput, ограничений по памяти, а также принципов батчинга;
Практический опыт работы с ONNX и базовые знания TensorRT; готовность углубляться в вопросы оптимизации;
Опыт работы с Docker — в частности, сборки образов и базовой отладки контейнеров;
Опыт интеграции моделей в backendсервисы (микросервисы, API, очереди) — хотя бы на уровне совместной работы с командой;
Готовность осваивать Triton Inference Server и ClearML при отсутствии глубокого опыта: умение изучать документацию, экспериментировать и доводить задачи до результата;
Умение читать чужой код, аккуратно его дорабатывать и поддерживать коммуникацию с авторами (DSспециалистами).

Будет плюсом:

Практический опыт деплоя моделей через Triton Inference Server;
Опыт работы с системами мониторинга (Prometheus, Grafana или аналогичные);
Опыт нагрузочного тестирования (locust);
Опыт оптимизации под конкретное железо (GPUсерверы, edgeустройства, специализированные ускорители);
Опыт работы в продуктовых командах, где MLмодели живут в продакшене и регулярно обновляются.

Мы предлагаем:

Работу в аккредитованной IT-компании и Трудоустройство в соответствии с ТК РФ;
Систему наставничества и комфортную адаптацию в компании;
Возможности для профессионального и карьерного роста.

Адрес: Москва, Большая кольцевая линия, метро Народное Ополчение

Откликнуться на вакансию

Спецпредложения

1

Philips HP 8233 Купить87.123р.
5

Dada Paradiso Group Carmelo (3 в 1) Купитьот 1132.599р.

Ночью:	°C
Утром:	°C
Днем:	°C
Вечером:	°C

Просмотр вакансии

Дата-сайентист

MLразработчик (Middle, Inference & MLOps)

Похожие вакансии

Спецпредложения