Просмотр вакансии

Сегодня 01-07-2026 13:42
11.06.2026, 14:58

ML/LLM-инженер

Работодатель: СтройМонтажПроект

Город: Самара
Занятость: Полная, 5/2
Опыт работы: От 1 года до 3 лет

О проекте

B2B SaaS-продукт, работающий с большими объёмами слабоструктурированных документов (PDF / DOCX / XLSX) и строящий на них аналитику. Сейчас вся обработка данных — rule-based (regex + словари). Запускается контур локального LLM-инференса для нормализации и извлечения структурированных данных.

Ограничение: данные — коммерческая тайна, деплой только on-prem, облачные LLM-API исключены — используются открытые модели локально.

ML/LLM-инженер Локальный LLM-инференс и извлечение данных из документов. On-prem, без облачны

Задачи

  • Эксперименты с открытыми LLM: подбор моделей и промптов под задачи извлечения, сравнение результатов.
  • Разработка кода извлечения структурированных данных (constrained JSON) из документов и таблиц на Python в существующем бэкенде.
  • Сбор и разметка наборов для оценки качества, расчёт метрик (точность по полям), отслеживание регрессий при смене модели или промпта.
  • Нормализация данных: дедупликация и сопоставление сущностей, очистка полей правилами и LLM.
  • Поддержка OCR-пайплайна для сканов (Tesseract / Surya / PaddleOCR).
  • Работа с очередью ручной проверки результатов.

Стек

Python 3.12, FastAPI, SQLAlchemy 2.0, PostgreSQL 16, Docker Compose. ML-часть строится с нуля: локальный инференс (vLLM / Ollama / llama.cpp), constrained decoding, эмбеддинги, pgvector, fine-tune (peft / unsloth).

Требования

  • Коммерческий опыт на Python — от 1 года: продакшен-код, работа в команде и с чужой кодовой базой.
  • Уверенный Python: ООП, структуры данных, чистый читаемый код.
  • Портфолио с проектами на LLM/ML — собственные или рабочие, с возможностью показать (GitHub) и разобрать.
  • Практический опыт с LLM: запуск моделей, написание промптов под задачи, RAG, работа с эмбеддингами.
  • Git, Docker. Английский на чтение документации.

Будет преимуществом

  • Опыт fine-tune (LoRA/QLoRA) или дообучения эмбеддеров.
  • Локальный запуск моделей: Ollama / llama.cpp / vLLM.
  • SQL, опыт с PostgreSQL.
  • Понимание основ ML: метрики качества, train/val, переобучение.
  • Обработка текста и таблиц (pandas, парсинг документов).
  • ML-соревнования (Kaggle и т. п.).

Адрес: Самара, улица Льва Толстого, 30А

 

Откликнуться на вакансию

Дата
30.06 01.07
USD
2.9066 2.9041
EUR
3.3144 3.3099
RUB
3.7386 3.7384
CNY
4.2675 4.2854
CHF
3.5944 3.5871
GBP
3.8419 3.8437
PLN
7.7269 7.6991
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения