Просмотр вакансии

Сегодня 24-03-2026 14:41
18.03.2026, 19:42

Senior AI/ML-инженер (LLM)

Работодатель: Технократия

Технократия

Город: Казань
Занятость: Полная занятость, Удаленная работа
Опыт работы: Более 6 лет

Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных проектах, совмещая скорость стартапов с надёжностью enterprise-разработки.

У нас прозрачные процессы, честные грейды и инженерная культура без бюрократии. У нас можно создавать международный финтех, влиять на продукт и расти в предсказуемой, честной и зрелой инженерной среде.

Прямо сейчас мы в поиске сильного AI/ML-инженера.

Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.

Чем предстоит заниматься?

  • Разрабатывать LLM routing и gateway слой;

  • Реализовывать и оптимизировать RAG-пайплайны;

  • Встраивать guardrails и AI safety механизмы;

  • Интегрировать LLM observability и трейсинг;

  • Оптимизировать inference по latency, throughput и стоимости;

  • Реализовывать evaluation-пайплайны качества ответов;

  • Работать с GPU-инфраструктурой и масштабированием.

Мы ожидаем:

  • Опыт работы ML-инженером от 5 лет;

  • Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели;

  • Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);

  • Глубокое знание Python и async-стека;

  • Умение проектировать и оценивать эксперименты, работать с метриками;

  • Продуктовый опыт работы с LLM;

  • Понимание рисков и безопасности LLM-систем.

Будет плюсом:

  • Agentic RAG и multi-agent системы;

  • Fine-tuning моделей (LoRA, QLoRA);

  • Multi-modal модели (vision, audio);

  • ASR, TTS, OCR, NER;

  • Опыт evaluation-фреймворков (RAGAS, deepeval);

  • Оптимизация inference (batching, KV-cache, quantization).

Почему мы?

  • График 5/2 по календарю РФ, гибкое начало рабочего дня до 10:00 по Московскому времени;
  • Уютный офис в центре Казани, возможность удаленной работы из других город;

  • Официальное трудоустройство в аккредитованной IT-компании со всеми плюшками;

  • Корпоративные уроки английского, фитнес прямо в офисе, футбольная команда, библиотека и партнёрские бенефиты;

  • Подарки к праздникам и здоровую атмосферу, где твой вклад ценят;

  • Поддержка профессионального развития — участие в конференциях, обучение, обмен опытом;

  • Открытая культура и высокий уровень доверия.

Адрес: Казань, Кремлёвская улица, 21А

 

Откликнуться на вакансию

Дата
24.03 25.03
USD
2.9765 2.9519
EUR
3.4213 3.4231
RUB
3.625 3.6507
UAH
6.784 6.7396
CHF
3.7528 3.7532
GBP
3.9489 3.9567
PLN
7.9798 8.0117
Минск
Утром: °C
Днем: °C
Вечером: °C
Ночью: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

Спецпредложения