Просмотр вакансии

Сегодня 05-07-2026 09:46
08.06.2026, 14:43

Middle ML Developer (Voice, ASR, STT/TTS)

Работодатель: Sifox

Sifox

Город: Москва
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет

Наша компания специализируется на разработке голосовых сервисов для телеком-индустрии. Мы внедряем наши продукты в сети крупных операторов мобильной связи, активно растем и, в связи с этим, усиливаем команду. Резидент «Сколково».

Локация: удаленно (с возможностью посещения офиса, Москва, м.Динамо)

Ищем Middle ML разработчика, который будет отвечать за разработку и масштабирование приложения для анализа и синтеза речи в режиме реального времени, также интеграции данного приложения в имеющуюся голосовую платформу.

Задачи

  • Реализация стримингового движка ASR для виртуального ассистента на основе open source библиотек
  • Участие в доработке файлового speech-to-text движка совместно с data science командой
  • Проектирование и улучшение компонент ASR, включая шумоподавление, акустическую и лингвистическую модели
  • Создание и улучшение модулей синтеза речи для диалоговых роботов
  • Обучение моделей ASR/TTS как для русского языка, так и для low source языков
  • Интеграция и масштабирование разработанных модулей в продукты компании
  • Доработка сторонних библиотек и при необходимости переписывание критичных к производительности компонент с python на другие языки
  • Оптимизация моделей и алгоритмов для обработки аудио под высокие нагрузки
  • Написание тестов и проведение нагрузочного тестирования
  • Взаимодействие с продуктовой командой, аналитиками и разработчиками платформы

Требования

  • Опыт в разработке голосовых приложений от 2х лет
  • Глубокие знания Python
  • Умение писать читаемый и тестируемый код с высокой степенью масштабируемости
  • Опыт продуктивизации голосовых ML моделей в высоконагруженных средах
  • Глубокое знание современного ML стека (pytorch, onnx, pytest, openvino, Triton Inference Server и др.)
  • Знание библиотек для работы с аудио, например: librosa, torchaudio и др.
  • Хорошее представление об известных ASR библиотеках: kaldi, nvidia nemo, espnet и др.
  • Понимание теории обработки речи и физики звука, умение работать со спектрограммами

Приветствуется

  • Знание различных языков программирования cython, С++, Erlang, SQL
  • Знакомство с инструментами: RabbitMQ, PostgreSQL, FreeSwitch
  • Опыт в телеком-проектах

Условия:

  • З/п - фикс + бонусы (уровень дохода обсуждается с финальным кандидатом)
  • Гибкий график (начало рабочего дня может обсуждаться с руководителем) при занятости full-time (40 ч/нед)
  • Формат работы: удаленный, с возможностью посещения офиса (при желании)
  • Оформление с соблюдением всех норм ТК РФ
  • ДМС (после 3 мес. испытательного периода)

Адрес: Москва, Ленинградский проспект, 36с40

 

Откликнуться на вакансию

Дата
05.07 06.07
USD
2.9062 2.905
EUR
3.3096 3.3156
RUB
3.731 3.7314
CNY
4.2833 4.2863
CHF
3.5857 3.6082
GBP
3.85 3.8754
PLN
7.7059 7.724
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения