Просмотр вакансии

Сегодня 30-06-2026 21:26
30.06.2026, 12:07

LlmOps-DevOps

Работодатель: Cloud.ru

Cloud.ru

Город: Москва
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет

Обязанности:

  • Развертывание и эксплуатация LLM:
    - Запуск и масштабирование больших языковых моделей (LLM) в продакшн-среде (инференс-кластеры).
    - Реализация техник оптимизации: квантизация (GPTQ, AWQ), vLLM, TensorRT-LLM, speculative decoding для снижения задержек (latency) и увеличения пропускной способности (throughput).
    - Настройка автоматического масштабирования (autoscaling) инференс-эндингов в зависимости от нагрузки.

  • Поддержка и развитие ML-архитектуры:

    - Сопровождение и рефакторинг текущей архитектуры ML Inference.
    - Разработка и поддержка платформенных решений для бесшовного переключения между разными моделями (A/B тестирование, канареечные деплои).
  • Сетевая инфраструктура для продуктов:
    - Проектирование и настройка высокоскоростной сетевой связности между GPU-кластерами (NVIDIA NCCL), объектным хранилищем (S3) и приложениями.
    - Настройка Service Mesh (Istio) и Ingress-контроллеров для маршрутизации трафика к AI-сервисам с учетом требований безопасности.
    - Обеспечение сетевой изоляции (VPC, Security Groups) для тенантов, работающих с чувствительными данными.

Требования:

  • Продвинутый опыт с Kubernetes (Helm, Kustomize, операторы).

  • Опыт работы с GPU-оператором (NVIDIA GPU Operator) и настройкой node-пулов с различными типами GPU (A100, H100, и др).

  • Уверенное владение инструментами для управления инфраструктурой как кодом (IaC).

  • Опыт развертывания LLM в продакшн с использованием vLLM, Sglang.

  • Желательно понимание техник оптимизации: квантизация (FP8, INT4/8), пакетная обработка (continuous batching), управление KV-cache. Глубокое понимание работы CNI (Calico, Cilium) в Kubernetes.

  • Опыт настройки балансировщиков нагрузки (NLB/ALB) для высоконагруженных AI-эндпоинтов.

  • Глубокое знание сетевой модели OSI, TCP/IP стека.

  • Опыт администрирования Unix-подобных ОС.

  • Опыт написания скриптов для автоматизации (Bash, Python).

  • Опыт администрирования веб-серверов, понимание протокола HTTP.

  • Опыт администрирования Open Source баз данных (Postgresql, Clickhouse и т.д.).

  • Практические знания и опыт в построении архитектуры, разработке и внедрении CI/CD решений.

  • Уверенное владение DevOps инструментами для сборки и развертывания приложений (Gitlab), опыт интеграции и настройки инструментов контроля и тестирования.

  • Опыт настройки и интеграции систем хранения секретов (Vault).

  • Владение Python/Go.

  • Большим преимуществом будет умение работать в Envoy - в частности его настройка и расширение при помощи extproc.

Адрес: Москва, 2-я Звенигородская улица, 12с2

 

Откликнуться на вакансию

Дата
30.06 01.07
USD
2.9066 2.9041
EUR
3.3144 3.3099
RUB
3.7386 3.7384
CNY
4.2675 4.2854
CHF
3.5944 3.5871
GBP
3.8419 3.8437
PLN
7.7269 7.6991
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения