Просмотр вакансии

Сегодня 24-03-2026 14:41

18.03.2026, 19:42

Senior AI/ML-инженер (LLM)

Город: Казань
Занятость: Полная занятость, Удаленная работа
Опыт работы: Более 6 лет

Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных проектах, совмещая скорость стартапов с надёжностью enterprise-разработки.

У нас прозрачные процессы, честные грейды и инженерная культура без бюрократии. У нас можно создавать международный финтех, влиять на продукт и расти в предсказуемой, честной и зрелой инженерной среде.

Прямо сейчас мы в поиске сильного AI/ML-инженера.

Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.

Чем предстоит заниматься?

Разрабатывать LLM routing и gateway слой;
Реализовывать и оптимизировать RAG-пайплайны;
Встраивать guardrails и AI safety механизмы;
Интегрировать LLM observability и трейсинг;
Оптимизировать inference по latency, throughput и стоимости;
Реализовывать evaluation-пайплайны качества ответов;
Работать с GPU-инфраструктурой и масштабированием.

Мы ожидаем:

Опыт работы ML-инженером от 5 лет;
Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели;
Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);
Глубокое знание Python и async-стека;
Умение проектировать и оценивать эксперименты, работать с метриками;
Продуктовый опыт работы с LLM;
Понимание рисков и безопасности LLM-систем.

Будет плюсом:

Agentic RAG и multi-agent системы;
Fine-tuning моделей (LoRA, QLoRA);
Multi-modal модели (vision, audio);
ASR, TTS, OCR, NER;
Опыт evaluation-фреймворков (RAGAS, deepeval);
Оптимизация inference (batching, KV-cache, quantization).

Почему мы?

График 5/2 по календарю РФ, гибкое начало рабочего дня до 10:00 по Московскому времени;
Уютный офис в центре Казани, возможность удаленной работы из других город;
Официальное трудоустройство в аккредитованной IT-компании со всеми плюшками;
Корпоративные уроки английского, фитнес прямо в офисе, футбольная команда, библиотека и партнёрские бенефиты;
Подарки к праздникам и здоровую атмосферу, где твой вклад ценят;
Поддержка профессионального развития — участие в конференциях, обучение, обмен опытом;
Открытая культура и высокий уровень доверия.

Адрес: Казань, Кремлёвская улица, 21А

Откликнуться на вакансию

Похожие вакансии

24.03.2026, 09:55|
Специалист по работе с документами в ГозПоддержка, КПКГ (З/п от 50000 RUR )
23.03.2026, 12:40|
Специалист чат поддержки в NEXT Contact (З/п от 42000 RUR )
24.03.2026, 08:09|
Помощник печатника в КПК ПС (З/п от 90000 RUR )
23.03.2026, 16:58|
Бухгалтер на первичную документацию в Кыстыбый (З/п от 93450 RUR )
17.03.2026, 10:00|
Сборщица/Сборщик товаров в Журавлева Елена Александровна (З/п до 154000 RUR )

НБ РБ
Обм. пункты

Дата

24.03 25.03

USD

2.9765 2.9519

EUR

3.4213 3.4231

RUB

3.625 3.6507

UAH

6.784 6.7396

CHF

3.7528 3.7532

GBP

3.9489 3.9567

PLN

7.9798 8.0117

Погода
На неделю

Минск

Утром:	°C
Днем:	°C
Вечером:	°C
Ночью:	°C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Вакансии
Поиск

Поторокин Андрей Владимирович
Администратор
З/п от 1300 BYR Витебск | 22-03-2026 21:51
Могилевский ф-л РУП БелЮрОбеспечение
Наборщик текста (Могилев) Могилев | 12-03-2026 11:10

Город
Профессиональная область
Специализация
Занятость
Опыт работы
Зарплата бел. руб
Найти

Спецпредложения

1

Philips HP 8233 Купить88.557р.
5

Dada Paradiso Group Carmelo (3 в 1) Купитьот 1151.241р.