Просмотр вакансии

Сегодня 07-10-2025 06:19
29.09.2025, 18:43

Tech Lead NLP

Работодатель: Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Город: Сириус
Занятость: Полная занятость, Полный день
Опыт работы: От 3 до 6 лет

ОЦРВ - часть одной из самых стабильных и масштабных структур в стране – ОАО «РЖД». Нас уже более 1200 человек. Вместе мы работаем над цифровизацией ж/д отрасли.

Сейчас мы находимся в поиске Руководителя группы обработки естественного языка в нашу R&D лабораторию «Сириус». Лаборатория занимается реализацией проектов в области ж/д транспорта с использованием технологий компьютерного зрения, обработки естественного языка и предиктивной аналитики.

Проекты связаны с безопасностью и эффективностью перевозочного процесса, её повышением и обеспечением. Проекты масштабные, нацелены на тиражируемость на всю сеть железных дорог.

Обязанности:

  • Проведение исследований в обработке естественного языка с применением технологий больших языковых моделей;
  • Разработка прикладных инструментов в области интеллектуальных средств обработки текстовой информации;
  • Генерация идей и гипотез для проведения исследований и обоснование их реализуемости и практической значимости;
  • Лидирование команды в части выполнения технических задач по проектам;
  • Постановка и распределение задач внутри команды, контроль сроков и результатов;
  • Подготовка публикаций и выступление на профильных конференциях;
  • Участие в мероприятиях (хакатонах, соревнованиях и тп) в качестве технического эксперта.

Требования:

  • Глубокое понимание архитектур языковых моделей: Знание различий, преимуществ и недостатков энкодеров (BERT, RoBERTa, DeBERTa), декодеров (GPT, Llama, Mistral) и архитектур encoder-decoder (T5, и др);
  • Знание современных LLM: Опыт работы с, открытыми моделями (Llama, Qwen, DeepSeek и др) и их спецификой;
  • Понимание и реализация RAG (Retrieval-Augmented Generation): Не просто использование, а глубокое понимание каждого компонента: чанки, embedding, векторные базы данных, ранжирование (re-ranking), стратегии сжатия контекста и т.д.;
  • Практический опыт различных стратегий дообучения (fine-tuning) и обучения с нуля (pre-training): Знание специфики обучения трансформеров. Опыт не только использования готовых пайплайнов, но и написания кастомных циклов обучения, создания собственных моделей;
  • Python (PyTorch, TensorFlow): Владение на уровне уверенного профессионала (не только для использования основных ML библиотек, но и глубокое понимание ООП, асинхронного программирования).
  • Data Engineering: Опыт построения ETL/ELT пайплайнов.
  • Векторные базы данных: практический опыт с одной или несколькими: Qdrant, Chroma. Понимание особенностей индексов (HNSW) и метрик поиска.
  • Хранилища данных: Опыт работы с большими объемами данных (S3, ClickHouse).

Мы предлагаем:

  • Комфортный офис в Сириусе;
  • Официальное оформление с первого дня работы в компании;
  • Заботу о здоровье. Оформим полис ДМС со стоматологией. Скидки на ДМС для родственников;
  • Годовую премию;
  • Индексацию заработной платы;
  • Доступ в спортивные залы парка Сириус (волейбол, баскетбол, футбол, настольный теннис);
  • Дополнительные дни к оплачиваемому отпуску;
  • Участие в самых интересных и масштабных проектах в отрасли;
  • Мы являемся аккредитованной ИТ Компанией.

Адрес: посёлок городского типа Сириус, Олимпийский парк, Международная улица, 2/1

 

Откликнуться на вакансию

Дата
06.10 07.10
USD
3.0056 3.039
EUR
3.5271 3.5455
RUB
3.6834 3.6771
UAH
7.2808 7.3526
CHF
3.7716 3.803
GBP
4.0428 4.0836
PLN
8.2906 8.3291
Минск
Утром: °C
Днем: °C
Вечером: °C
Ночью: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

  • Гаджет Ленд
    Водитель
    З/п от 2000 BYR Гродно | 06-10-2025 07:54
Спецпредложения