Город: Воронеж
Занятость: Полная, 5/2
Опыт работы: От 3 до 6 лет
Обязанности:
-
Приём, анализ и обработка обращений в техническую поддержку (L2-уровень);
-
Мониторинг состояния сервисов, инфраструктурных контуров и ключевых метрик производительности;
-
Анализ логов: инфраструктурных, системных и прикладных — с использованием инструментов ELK, Grafana Loki и др.;
-
Диагностика инцидентов, локализация причин сбоев, взаимодействие с командой развития;
-
Обновление системного и прикладного программного беспечения в рамках регламентов эксплуатации;
-
Проведение обновлений ОС (Linux) и патчей ПО в соответствии с регламентами эксплуатации (релизы, хот фиксы);
-
Участие в релизном цикле:
-
Подготовка к выводу изменений в прод;
-
Контроль корректности развертывания и проверка работоспособности после релиза;
-
проверка эксплуатационной и технической документации;
-
Работа над улучшением SLA/SLO: анализ частоты и причин инцидентов, предложение и реализация мер по повышению надёжности;
-
Автоматизация рутинных задач: написание скриптов, интеграция с системами мониторинга.
- Уверенное владение Linux (консоль, диагностика, базовые компоненты ОС);
- Используемые дистрибутивы: Ubuntu Server, Astra Linux;
- Опыт работы с systemd, journald, tcpdump, strace;
- Понимание сетевых основ (TCP/IP, DNS, TLS);
- Навыки написания простых bash/python-скриптов;
- Понимание работы микросервисной архитектуры, умение работать и диагностировать Docker, K8s;
- Понимание жизненного цикла инцидента;
- Опыт работы с логами;
- Опыт настройки и работы с системами мониторинга Grafana, Prometheus, Zabbix;
- Базовый опыт работы с базами данных MongoDB, PostgreSQL.
Будет плюсом: - Навыки создания сложных промт-запросов для ИИ;
- Понимание архитектуры генеративных моделей;
- Умение администрировать GPU в ОС Linux;
- Понимание принципов RAG;
- Понимание значения метрик Latency и Token usage;
- Опыт работы с Active Directory и Keycloak (аутентификация, SSO, политики доступа);
- Системы хранения данных: - распределённые объектные хранилища (MinIO или аналоги);
- - классические файловые и блочные хранилища;
- Серверы приложений и прикладные сервисы: принципы развертывания, обновления и мониторинга;
- Услуги облачных провайдеров и хостинг-провайдеров:
- базовое понимание моделей предоставления услуг (IaaS / PaaS);
- взаимодействие с поддержкой провайдеров при инцидентах.
Наши технологии:
- Виртуализация: OpenStack
- Контейнеризация: Docker, Kubernetes (K8s)
- Хранилища: MongoDB, PostgreSQL, MinIO
- Управление доступом: Keycloak, Active Directory
- CI/CD и управление кодом: GitLab
- Мониторинг: Prometheus + Grafana, Zabbix
- Логирование: ELK-стек / Loki + Grafana
- Инструменты: Jira, Confluence
Пожелания:
- Интерес и желание развиваться в сторону DevOps / SRE;
- Готовность разбираться в причинах проблем, а не только «закрывать тикеты».
Похожие вакансии