Что предстоит делать
- Реагировать на инциденты: диагностика, устранение, восстановление сервисов.
- Проводить пост-инцидентный анализ, находить корневые причины, внедрять меры против повторения.
- Развёртывать и сопровождать кластеры Kubernetes (в том числе через Kubespray): namespaces, deployments, ingress, secrets, storage, RBAC, network policies.
- Администрировать MariaDB/MySQL, ClickHouse и сопутствующие инфраструктурные сервисы.
- Развивать мониторинг и алертинг на Prometheus + Grafana, настраивать централизованное логирование.
- Поддерживать и улучшать CI/CD-пайплайны в GitLab CI.
- Автоматизировать рутину скриптами и внутренними инструментами.
- Проводить аудиты безопасности инфраструктуры, контролировать конфигурации, доступы, секреты, сетевые политики.
- Поддерживать периферийные сервисы: сайты, API, служебные приложения.
- Участвовать в проектировании архитектуры, готовить рекомендации по масштабированию и отказоустойчивости.
- Работать в связке с разработчиками на стыке приложения и инфраструктуры.
Что мы ждём
- От 3 лет опыта на позиции DevOps / SRE / сисадмина.
- Практический опыт администрирования Kubernetes, в том числе развёртывания через Kubespray.
- Понимание контейнеризации, сетей, ingress-контроллеров, service discovery, persistent volumes, RBAC.
- Опыт настройки Prometheus + Grafana, алертинга, анализа метрик при расследовании деградаций.
- Опыт работы с GitLab CI/CD: пайплайны, переменные окружения, деплой, автоматизация сборок.
- Навыки скриптинга: Bash, Node.js или аналоги.
- Базовое понимание инфраструктурной безопасности: доступы, секреты, firewall, TLS, hardening.
- Готовность быть на связи в течение рабочего дня и оперативно реагировать.
- Умение доводить задачи до результата и документировать важные изменения.
Будет плюсом
- Production-опыт администрирования MariaDB/MySQL и ClickHouse.
- Опыт работы с высоконагруженными игровыми или real-time сервисами, в идеале RAGE:MP или подобные multiplayer-платформы.
- Настройка резервного копирования и восстановления БД.
- Опыт с балансировщиками, reverse proxy, CDN, DNS, TLS-сертификатами.
- Опыт внедрения централизованного логирования (Loki, ELK/EFK).
- Опыт оптимизации инфраструктуры по производительности и стоимости.
Что предлагаем
- Формат работы: удалёнка
- Занятость: полная / частичная
- Оплата: обсуждается по итогам собеседования
- Команда, которая ценит системные улучшения, а не только тушение пожаров.
Контакты
Telegram: ragedevs