Город: Сербия
Занятость: Полная, 5/2
Опыт работы: Более 6 лет
Международная продуктовая компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках SRE/DevOps инженера.
Чем предстоит заниматься:
- Поддержка и развитие Observability-стратегии, стандартизация подходов и консультирование команд разработки
- Обеспечение надежной работы приложений в Kubernetes в production, включая диагностику инцидентов и анализ работы распределенных систем
- Развитие и поддержка Observability-платформы (metrics/logs/traces), включая стек VM stack, CloudWatch, ELK и сопутствующие инструменты
- Обеспечение мониторинга, алертинга и дашбордов с учетом архитектуры сервисов и требований production
- Поддержка команд разработки в вопросах эксплуатации сервисов, инцидентов и взаимодействия между системами
- Обеспечение полного цикла работы с production-инцидентами: OnCall-реагирование (PagerDuty), координация устранения восстановление сервисов, RCA/Post-Mortem и внедрение reliability improvements по итогам инцидентов
- Развитие практик Incident Management и reliability engineering, направленных на снижение повторяемости инцидентов и повышение стабильности production-систем
Наши ожидания от кандидата:
- 3+ года опыта в роли SRE Engineer
- Практический опыт работы с Observability-стеком (OpenTelemetry, Grafana, Loki, Tempo, Mimir, VictoriaMetrics, ELK, Vector, Sentry)
- Глубокий опыт работы с Kubernetes в production, включая диагностику и устранение инцидентов
- Опыт работы с CI/CD (GitLab CI/СD), GitOps (Argo CD), уверенное владение Git и работа с различными моделями ветвления
- Практический опыт разработки и поддержки Helm chart
- Опыт работы с контейнеризацией и build-инструментами (Docker, Kaniko, BuildKit)
- Опыт участия в OnCall и работе с критическими инцидентами
- Опыт проведения RCA/Post-Mortem и внедрения улучшений reliability
- Умение работать с кросс-функциональными командами и четко доносить технические решения
- Проактивность и ориентация на системные улучшения reliability и observability
Что компания может вам предложить:
- Удаленный/офисный/гибрид формат работы (Зависит от локации кандидата)
- Возможность развивать свои компетенции и применять знания на практике
- Возможность поработать на крупных проектах
- Компания заинтересована в развитии своих сотрудников: готовы привлекать наставников и оплачивать курсы для повышения квалификации
- Отсутствие бюрократии, быстрое согласование необходимых вещей
- Оплачиваемые лист нетрудоспособности (больничный лист) и отпускные
- Частичная компенсация английского или сербского языков
- 4 day-off в год за счет компании
- Компания поддерживает сотрудника в важные периоды жизни
- Годовой бонус по результатам работы
- Большая высококвалифицированная команда, к которой всегда можно обратиться за помощью
- Реферальная программа за успешную рекомендацию
Адрес: Белград
Похожие вакансии