Просмотр вакансии

Сегодня 03-07-2026 20:51
03.07.2026, 12:41

LLM/RAG/AI Engineer (GigaChat Enterprise)

Работодатель: Салют для Бизнеса

Город: Москва
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет

Мы - команда GigaChat Enterprise, дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.

Обязанности:

  • Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
  • Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
  • Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
  • Настраивать и оптимизировать векторный и гибридный поиск
  • Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
  • Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
  • Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
  • Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
  • Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

  • Опыт работы от 3х лет
  • Опыт работы с AI инструментами: от года
  • Опыт создания RAG-систем
  • Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
  • Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
  • LangChain, LlamaIndex
  • LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
  • Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
  • Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
  • Embedding-модели: e5, bge, multilingual-e5
  • Python, Git, Docker, docker-compose
  • PostgreSQL, Redis
  • Методы оценки: hit rate, RAGAS, human evaluation
  • Способность объяснить принятые технические решения и их trade-offs

Условия

  • достойная заработная плата + годовой бонус
  • сильная команда
  • ДМС, с первого рабочего дня
  • работа в аккредитованной IT компании
  • льготная ипотека от Сбера
  • локация: Москва, м. Цветной бульвар.

Адрес: Москва, Цветной бульвар

 

Откликнуться на вакансию

Дата
05.07 06.07
USD
2.9062 2.905
EUR
3.3096 3.3156
RUB
3.731 3.7314
CNY
4.2833 4.2863
CHF
3.5857 3.6082
GBP
3.85 3.8754
PLN
7.7059 7.724
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения