Просмотр вакансии

Сегодня 27-06-2026 10:41
26.06.2026, 09:28

ML-инженер

Работодатель: ЮНИСТРИМ БАНК

ЮНИСТРИМ БАНК

Город: Москва
Занятость: Полная, 5/2
Опыт работы: От 1 года до 3 лет

Мы планируем построить и внедрить локальные LLM-решения для автоматизации внутренних бизнес-процессов. Наша цель — обеспечить высокий уровень безопасности данных, контролируемость инфраструктуры и независимость от внешних облачных провайдеров, где это критично. Мы ищем инженера, который сможет спроектировать архитектуру, настроить пайплайны и вывести модели в промышленную эксплуатацию в корпоративном контуре.

Обязанности:

  • Архитектура и разработка: Проектирование и разработка корпоративной LLM-платформы с фокусом на локальное развертывание (on-premise) и использование open-source моделей;

  • Интеграция фреймворков: Построение пайплайнов обработки данных и оркестрации запросов с использованием Open WebUI, LiteLLM, Langflow и RAGFlow для создания RAG-приложений и агентных рабочих процессов;

  • Инфраструктура и инференс: Настройка высокопроизводительного инференса моделей с использованием vLLM для обеспечения низкой задержки и эффективного использования GPU-ресурсов;

  • Унификация доступа: Настройка единого шлюза для управления подключениями к различным LLM (как локальным, так и внешним через OpenRouter) для гибкости и резервирования;

  • Интеграция и автоматизация: Встраивание ML-решений во внутренние системы компании (CRM, HRM, документооборот) и автоматизация рутинных задач сотрудников;

  • MLOps/LLMOps: Внедрение практик мониторинга, версионирования промптов и моделей, а также CI/CD для ML-компонентов.

Требования:
  • От 2-х лет коммерческого опыта в разработке и внедрении ML/AI решений;

  • Стек технологий (Core):

  1. Глубокое знание и опыт работы с указанным стеком: Open WebUI (как интерфейс для взаимодействия с моделями);

  2. LiteLLM (прокси-сервер для унификации API), Langflow или LangChain (оркестрация цепочек), RAGFlow (реализация RAG-пайплайнов);

  3. Опыт оптимизации инференса моделей с использованием vLLM или аналогичных библиотек (TensorRT, ONNX);

  4. Знание OpenRouter как агрегатора API-провайдеров.

  • Разработка: Продвинутый уровень Python (асинхронное программирование, FastAPI);

  • Базы данных: Опыт работы с векторными базами данных (Pinecone, Milvus, Qdrant, FAISS);

  • Инфраструктура: Опыт контейнеризации и оркестрации (Docker и тп), понимание принципов работы GPU в кластере.

Будет плюсом:

  • Опыт работы с локальными open-source моделями (Llama, Qwen, Deepseek);
  • Опыт интеграции AI в корпоративные системы (1С, SAP, Jira, Confluence, Битрикс24 и тп);
  • Знание MLOps практик (MLflow, Weights & Biases);
  • Опыт построения систем с учетом требований информационной безопасности и соблюдения локального законодательства (152-ФЗ) — использование локальной инфраструктуры для обработки персональных данных.

Личные качества (Soft Skills):

  • Системное мышление и способность видеть продукт целиком, а не только ML-модель;
  • Коммуникабельность: умение объяснять технические решения бизнес-заказчикам и стейкхолдерам;
  • Проактивность: готовность предлагать архитектурные решения и брать ответственность за их реализацию;
  • Стремление к изучению нового: быстро меняющийся стек LLM требует постоянного самообучения.
Условия:
  • Интересные задачи и проекты;
  • Оформление по ТК РФ;
  • Официальная заработная плата (уровень оплаты труда, обсуждается с успешным кандидатом на собеседовании);
  • График работы 5/2 пн-чт с 09.30 до 18.15, пятница с 09.30 до 17.00;
  • Возможность гибридного или удаленного формата работы.

Адрес: Москва, Большая кольцевая линия, метро Петровский парк

 

Откликнуться на вакансию

Дата
28.06 29.06
USD
2.8228 2.8858
EUR
3.2072 3.292
RUB
3.77 3.7443
CNY
4.1492 4.2289
CHF
3.4781 3.5704
GBP
3.722 3.8149
PLN
7.4788 7.6833
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения