Просмотр вакансии

Сегодня 30-06-2026 21:53
30.06.2026, 18:24

MLразработчик (Middle, Inference & MLOps)

Работодатель: Автономные Технологии

Автономные Технологии

Город: Москва
Зарплата:  от 200000 RUR
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет

Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных инженерных решений.

Чем предстоит заниматься:

  • Приводить код DS к продакшенкачеству: выполнять рефакторинг, выстраивать структуру проекта, писать тесты, настраивать логирование;

  • Конвертировать и компилировать модели в ONNX, TensorRT и RKNN; настраивать рантаймы под разные типы оборудования (CPU, GPU, edgeустройства);

  • Оптимизировать инференс: проводить профилирование, устранять узкие места (ботлнеки), добавлять кастомные операции;

  • Использовать Triton Inference Server для деплоя и оркестрации моделей: настраивать конфигурации и маршрутизацию запросов;

  • Разрабатывать и поддерживать сервисыобвязки для инференса моделей;

  • Проводить нагрузочное тестирование сервисов инференса, выявлять узкие места и оптимизировать производительность;

  • Совместно с DevOps развёртывать модели: обеспечивать контейнеризацию (Docker), реализовывать базовый CI/CD;

  • Настраивать мониторинг и алертинг для моделей и сопутствующих сервисов: отслеживать метрики производительности, ошибок и деградации качества;

  • Развивать и настраивать внутреннюю MLOpsплатформу (ClearML): вести трекинг экспериментов, версионировать датасеты и модели, настраивать пайплайны.

Мы ожидаем:

  • Не менее 3 лет коммерческой разработки на Python; сформированную культуру разработки — в том числе навыки тестирования, логирования, типизации, соблюдения принципов чистого кода и выстраивания понятной структуры проектов;

  • Опыт работы с фреймворками машинного обучения (преимущественно PyTorch);

  • Понимание особенностей инференса моделей в продакшене: таких параметров, как latency и throughput, ограничений по памяти, а также принципов батчинга;

  • Практический опыт работы с ONNX и базовые знания TensorRT; готовность углубляться в вопросы оптимизации;

  • Опыт работы с Docker — в частности, сборки образов и базовой отладки контейнеров;

  • Опыт интеграции моделей в backendсервисы (микросервисы, API, очереди) — хотя бы на уровне совместной работы с командой;

  • Готовность осваивать Triton Inference Server и ClearML при отсутствии глубокого опыта: умение изучать документацию, экспериментировать и доводить задачи до результата;

  • Умение читать чужой код, аккуратно его дорабатывать и поддерживать коммуникацию с авторами (DSспециалистами).

Будет плюсом:

  • Практический опыт деплоя моделей через Triton Inference Server;
  • Опыт работы с системами мониторинга (Prometheus, Grafana или аналогичные);
  • Опыт нагрузочного тестирования (locust);
  • Опыт оптимизации под конкретное железо (GPUсерверы, edgeустройства, специализированные ускорители);
  • Опыт работы в продуктовых командах, где MLмодели живут в продакшене и регулярно обновляются.

Мы предлагаем:

  • Работу в аккредитованной IT-компании и Трудоустройство в соответствии с ТК РФ;
  • Систему наставничества и комфортную адаптацию в компании;
  • Возможности для профессионального и карьерного роста.

Адрес: Москва, Большая кольцевая линия, метро Народное Ополчение

 

Откликнуться на вакансию

Дата
30.06 01.07
USD
2.9066 2.9041
EUR
3.3144 3.3099
RUB
3.7386 3.7384
CNY
4.2675 4.2854
CHF
3.5944 3.5871
GBP
3.8419 3.8437
PLN
7.7269 7.6991
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения