Город: Москва
Зарплата:
от 200000
RUR
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет
Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных инженерных решений.
Чем предстоит заниматься:
-
Приводить код DS к продакшенкачеству: выполнять рефакторинг, выстраивать структуру проекта, писать тесты, настраивать логирование;
-
Конвертировать и компилировать модели в ONNX, TensorRT и RKNN; настраивать рантаймы под разные типы оборудования (CPU, GPU, edgeустройства);
-
Оптимизировать инференс: проводить профилирование, устранять узкие места (ботлнеки), добавлять кастомные операции;
-
Использовать Triton Inference Server для деплоя и оркестрации моделей: настраивать конфигурации и маршрутизацию запросов;
-
Разрабатывать и поддерживать сервисыобвязки для инференса моделей;
-
Проводить нагрузочное тестирование сервисов инференса, выявлять узкие места и оптимизировать производительность;
-
Совместно с DevOps развёртывать модели: обеспечивать контейнеризацию (Docker), реализовывать базовый CI/CD;
-
Настраивать мониторинг и алертинг для моделей и сопутствующих сервисов: отслеживать метрики производительности, ошибок и деградации качества;
-
Развивать и настраивать внутреннюю MLOpsплатформу (ClearML): вести трекинг экспериментов, версионировать датасеты и модели, настраивать пайплайны.
Мы ожидаем:
-
Не менее 3 лет коммерческой разработки на Python; сформированную культуру разработки — в том числе навыки тестирования, логирования, типизации, соблюдения принципов чистого кода и выстраивания понятной структуры проектов;
-
Опыт работы с фреймворками машинного обучения (преимущественно PyTorch);
-
Понимание особенностей инференса моделей в продакшене: таких параметров, как latency и throughput, ограничений по памяти, а также принципов батчинга;
-
Практический опыт работы с ONNX и базовые знания TensorRT; готовность углубляться в вопросы оптимизации;
-
Опыт работы с Docker — в частности, сборки образов и базовой отладки контейнеров;
-
Опыт интеграции моделей в backendсервисы (микросервисы, API, очереди) — хотя бы на уровне совместной работы с командой;
-
Готовность осваивать Triton Inference Server и ClearML при отсутствии глубокого опыта: умение изучать документацию, экспериментировать и доводить задачи до результата;
-
Умение читать чужой код, аккуратно его дорабатывать и поддерживать коммуникацию с авторами (DSспециалистами).
Будет плюсом:
- Практический опыт деплоя моделей через Triton Inference Server;
- Опыт работы с системами мониторинга (Prometheus, Grafana или аналогичные);
- Опыт нагрузочного тестирования (locust);
- Опыт оптимизации под конкретное железо (GPUсерверы, edgeустройства, специализированные ускорители);
- Опыт работы в продуктовых командах, где MLмодели живут в продакшене и регулярно обновляются.
Мы предлагаем:
- Работу в аккредитованной IT-компании и Трудоустройство в соответствии с ТК РФ;
- Систему наставничества и комфортную адаптацию в компании;
- Возможности для профессионального и карьерного роста.
Адрес: Москва, Большая кольцевая линия, метро Народное Ополчение
Похожие вакансии