Просмотр вакансии

Сегодня 29-06-2026 00:17
03.06.2026, 20:10

Инженер по эксплуатации Linux-инфраструктуры / SRE

Работодатель: Тихонова Екатерина Олеговна

Город: Москва
Зарплата:  от 120000 до 180000 RUR
Занятость: Полная, 5/2
Опыт работы: Нет опыта

Мы развиваем большую распределенную инфраструктуру с крупным парком серверов и ищем инженера, который будет отвечать за ее стабильность.

Нам нужен человек, который не ограничивается реакцией на алерты, а умеет докапываться до причин: почему сервис деградировал, почему выросла нагрузка, почему отвалился узел, почему мониторинг заметил проблему слишком поздно. Важно, чтобы тебе было интересно не просто «потушить пожар», а сделать так, чтобы он не повторился.

Входной фильтр

Если ты прочитал вакансию внимательно, начни отклик со слов: Я работал в... — и перечисли компании или проекты, где ты лично отвечал за доступность серверов и участвовал в разборе инцидентов.

Чем предстоит заниматься

  • Следить за стабильностью инфраструктуры и быстро реагировать на сбои.
  • Разбирать инциденты: находить первопричины, фиксировать выводы, предлагать изменения.
  • Развивать мониторинг и алертинг на базе Prometheus, Grafana, VictoriaMetrics или похожего стека.
  • Настраивать дашборды так, чтобы было видно реальное состояние сервисов, а не только факт, что сервер отвечает на ping.
  • Искать слабые места в конфигурациях Nginx, Redis, ClickHouse и системных настройках Linux.
  • Автоматизировать рутинные операции через Ansible; Terraform будет плюсом.
  • Настраивать health checks, failover-сценарии и механизмы восстановления сервисов.
  • Участвовать в улучшении процессов эксплуатации: от регламентов до автоматизации повторяющихся задач.

Что важно

  • Опыт эксплуатации Linux-инфраструктуры от 5 лет.
  • Опыт работы с production-системами под нагрузкой.
  • Хорошее понимание Linux: сеть, диски, память, процессы, systemd, логи.
  • Уверенная работа с Nginx: настройка, оптимизация, диагностика проблем.
  • Понимание Redis: репликация, отказоустойчивость, базовая диагностика.
  • Опыт с ClickHouse на уровне базового администрирования и понимания типовых проблем.
  • Умение строить полезный мониторинг, писать PromQL-запросы и настраивать понятные алерты.
  • Опыт с Ansible. Terraform будет плюсом.
  • Умение спокойно и быстро разбираться в инцидентах: сеть, I/O, CPU, RAM, лимиты, конфиги, зависимости между сервисами.

Нам подойдет человек, который

  • Не боится сложной инфраструктуры.
  • Любит порядок в мониторинге, конфигурациях и документации.
  • Умеет объяснить, что произошло, без лишней воды.
  • После инцидента думает не только «как восстановить», но и «как не допустить повторения».
  • Готов предлагать улучшения и доводить их до внедрения.

Что предлагаем

  • Удаленную работу.
  • Гибкое начало рабочего дня.
  • Минимум бюрократии и прямое общение с технической командой.
  • Инфраструктуру, где действительно есть чем заниматься: много серверов, нагрузка, реальные инженерные задачи.
  • Возможность влиять на технические решения и улучшать систему, а не просто закрывать тикеты.

 

Откликнуться на вакансию

Дата
28.06 29.06
USD
2.8228 2.8858
EUR
3.2072 3.292
RUB
3.77 3.7443
CNY
4.1492 4.2289
CHF
3.4781 3.5704
GBP
3.722 3.8149
PLN
7.4788 7.6833
Минск
Ночью: °C
Утром: °C
Днем: °C
Вечером: °C

Сейчас: Скорость ветра: 5-7 м/c Атм. давление: 758 мм.рт.ст Влажность: 90%

  • Мардоян Артём Размикович
    Бармен
    З/п от 1000 BYR Сморгонь | 28-06-2026 23:47
  • ЛУВАРО
    Водитель
    З/п от 2500 до 2800 BYR Минск | 28-06-2026 23:24
Спецпредложения