
Город: Астана
Занятость: Полная занятость, Полный день
Опыт работы: От 1 года до 3 лет
Что нужно делать?
1. Разработка и доработка ML-моделей
* Разработка моделей машинного обучения и глубокого обучения (CV, NLP, Multimodal, VLM).
* Использование фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
* Тонкая настройка (fine-tuning) готовых моделей на собственных данных.
* Конвертация моделей в ONNX и оптимизация с помощью TensorRT для ускорения инференса.
2. Работа с данными
* Предобработка, очистка и анализ больших объёмов данных.
* Взаимодействие с VectorDB (например, FAISS, Chroma, Weaviate, Pinecone) в задачах RAG.
3. RAG и векторный поиск
* Проектирование систем Retrieval-Augmented Generation (RAG).
* Индексация документов, извлечение контекста с помощью embedding-моделей.
* Интеграция с LLM (в том числе через Hugging Face или OpenAI API).
* Построение пайплайнов для чата с документами или внутренней базы знаний.
4. Деплой и продакшн
* Разработка REST API с использованием FastAPI или Flask.
* Контейнеризация моделей и приложений с помощью Docker и Docker + GPU (nvidia-docker).
* Оркестрация и масштабирование через Kubernetes.
* Работа с RabbitMQ для асинхронной очереди задач и микросервисной архитектуры.
5. Мониторинг и сопровождение
* Мониторинг качества и производительности моделей в продакшене (latency, drift, accuracy).
* Логирование, алерты, перезапуск пайплайнов при сбоях.
* Регулярное переобучение и откат моделей при необходимости.
6. Взаимодействие в команде
* Совместная работа с DevOps, аналитиками, инженерами и продуктовой командой.
* Участие в код-ревью, проектировании архитектуры решений.
* Поддержка экспериментов с LLM/VLM и их интеграция в реальные продукты.
-
Условия:
- Участие в создании инновационного продукта с нуля.
- Работа в небольшой, но динамичной команде.
- Возможность влиять на архитектуру и развитие проекта.
- Уровень оплаты обсуждается индивидуально исходя из навыков и опыта работы кандидата.
Адрес: Астана, улица Абикена Бектурова, 7
Похожие вакансии