SRE
Site Reliability Engineer
Обеспечение надежности и отказоустойчивости систем
99.9%
Uptime SLA
24/7
Мониторинг
<15мин
MTTR
О профессии SRE
Автоматизация
Автоматизация рутинных задач, CI/CD пайплайны, Infrastructure as Code
Мониторинг
Построение систем мониторинга, алертинг, дашборды, SLO/SLI метрики
Отказоустойчивость
Проектирование надежных систем, disaster recovery, chaos engineering
Производительность
Оптимизация производительности, capacity planning, load balancing