Просмотр вакансии

Сегодня 05-07-2026 11:53
22.06.2026, 13:45

Senior Python/RAG Developer (GigaChat)

Работодатель: СБЕР

СБЕР

Город: Москва
Занятость: Полная
Опыт работы: Более 6 лет

Наша команда разрабатывает RAG-архитектуру для GigaChat (модель и сайт).

Основные задачи, которые выполняет сервис RAG (Retrieval Augmented Generation):

  • поиск релевантной информации: RAG осуществляет эффективный поиск и извлечение данных из внешних баз знаний, документов или других источников, которые могут содержать ответ на запрос пользователя.
  • дополнение контекста: найденные данные добавляются к запросу, который затем передается генеративной языковой модели (LLM), чтобы обогатить и уточнить ответ.
  • генерация точного и обоснованного ответа: на основе как внутреннего знания модели, так и извлеченной релевантной информации RAG создает ответ, который более точен и менее подвержен ошибочным или вымышленным фактам (галлюцинациям).
  • актуализация данных: позволяет получать ответы на основе свежих и обновляемых данных без необходимости переобучения самой языковой модели.
  • поддержка факточекинга и ссылок на источники: RAG может предоставлять ссылки на исходные документы или данные, подтверждающие ответ.
  • использование в специализированных задачах: решение вопросов в узкоспециализированных областях, таких как техническая поддержка, юридическая консультация, HR, клиентский сервис и интернет-магазины, где важна точность и своевременность информации.
  • снижение рисков ошибок и галлюцинаций: минимизация случаев, когда модель выдает ложные или неточные сведения.

Обязанности

  • проектировать архитектуру backend-сервисов и RAG-систем
  • руководить разработкой ключевых компонентов на Python / FastAPI
  • принимать технические решения по API, данным, очередям, интеграциям и RAG-пайплайнам
  • оптимизировать производительность, надежность и стоимость backend- и LLM-компонентов
  • развивать подходы к поиску: semantic search, hybrid search, reranking, metadata filtering
  • обеспечивать качество кода, проводить code review и помогать junior/middle-разработчикам
  • исследовать новые технологии в области LLM, RAG и backend-разработки.

Требования

  • 5+ лет коммерческого опыта backend-разработки, преимущественно на Python.
  • глубокое знание Python, FastAPI, асинхронного программирования и архитектуры backend-сервисов.
  • сильный опыт работы с PostgreSQL, Redis, Docker / Docker Compose.
  • опыт работы с Qdrant или другими vector databases в production.
  • глубокое понимание RAG: ingestion, chunking, embeddings, retrieval, reranking, generation, evaluation.
  • опыт интеграции LLM API и понимание их ограничений: latency, cost, rate limits, hallucinations.
  • опыт работы с Kafka в production-сценариях.
  • опыт проектирования микросервисной архитектуры.
  • умение писать поддерживаемый, тестируемый и расширяемый код.
  • опыт технического лидерства, декомпозиции задач и code review.
  • английский язык на уровне чтения технической документации.

Условия

  • возможность выбрать удобный формат работы: гибрид или офис
  • комфортный современный офис рядом с м. Кутузовская
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

 

Откликнуться на вакансию

Дата
05.07 06.07
USD
2.9062 2.905
EUR
3.3096 3.3156
RUB
3.731 3.7314
CNY
4.2833 4.2863
CHF
3.5857 3.6082
GBP
3.85 3.8754
PLN
7.7059 7.724
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

  • БелВТИ
    Грузчик
    З/п от 1600 BYR Вилейка | 05-07-2026 11:38
Спецпредложения