Задачи
– Обеспечение стабильной и отказоустойчивой работы инфраструктуры.
– Построение и поддержка CI/CD: непрерывная интеграция и доставка кода.
– Мониторинг и наблюдаемость: метрики, логи, алерты, инциденты.
– Управление инфраструктурой как кодом (IaC).
– Совместная работа с разработкой: улучшение релизного процесса, устранение узких мест.
– Реакция на инциденты, разбор причин, предотвращение повторений (postmortem без поиска виноватых).
Технологический стек
– Контейнеризация и оркестрация: Docker, Kubernetes
– CI/CD: GitLab
– Scripting: Bash (обязательно), Python (желательно)
– Monitoring & Observability:
– Prometheus
– Grafana
– Loki и/или ELK
– Sentry
– Secrets: Vault
– Базы данных: PostgreSQL
– Cloud: Amazon AWS, Yandex Cloud
Что для нас важно
– Коммерческий опыт в роли DevOps / SRE.
– Понимание CI/CD не как «скриптов», а как процесса.
– Опыт построения мониторинга по метрикам и логам, а не «на глаз».
– Аккуратность, системность и умение документировать решения.
Будет плюсом
– Опыт в финтехе или высоконагруженных системах.
– IaC: OpenTofu / Terraform
– Ingress / networking: Traefik
– OpenTelemetry (OTel)
– Практический опыт работы с Kubernetes в продакшене.
– Понимание принципов SRE.
– Опыт внедрения OpenTelemetry end-to-end.
– Опыт оптимизации стоимости облачной инфраструктуры.
Условия
– Полная занятость
– Работа в офисе в Москве
– Зарплата обсуждается индивидуально