Город: Москва
Занятость: Полная
Опыт работы: Нет опыта
Мы ищем опытного лидера, который возглавит направление alignment для базовой AI-модели и будет отвечать за развитие ключевых технологий обучения и совершенствования интеллектуальных систем. Эта роль — уникальная возможность управлять командой из более чем 20 специалистов (ML-инженеры, исследователи, data-специалисты) и напрямую влиять на качество и конкурентоспособность продукта.
Обязанности
- Управление командой alignment:
- Формирование, развитие и мотивация команды специалистов по машинному обучению и анализу данных
- Распределение задач, контроль сроков и качества выполнения проектов.
- Наставничество, развитие технических и управленческих компетенций сотрудников
- Построение и развитие процессов обучения моделей:
- Организация и оптимизация пайплайнов для Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), Reinforcement Learning (RL)
- Внедрение новых подходов к обучению, в том числе с использованием онлайн- и офлайн-данных
Требования
- Глубокое понимание современных методов alignment: SFT, RL, preference learning, DPO, RLHF и др
- Практический опыт работы с большими языковыми моделями (LLM), включая их обучение, дообучение и оценку
- Опыт работы с бенчмарками качества моделей, умение анализировать метрики и интерпретировать результаты
- Системное мышление, способность принимать решения в условиях неопределённости
- Отличные коммуникативные навыки, умение выстраивать эффективное взаимодействие между разными подразделениями
Условия
- Сильные и сложные задачи на переднем крае развития русскоязычных LLM
- Большую степень влияния на архитектуру решений, методы обучения и качество итоговой модели
- Команду сильных инженеров и исследователей
- Возможность совмещать управление направлением с глубокой технической работой
- Конкурентную компенсацию, премии и расширенный соцпакет
Похожие вакансии