SRE и Observability: мониторинг, управление инцидентами и DORA-метрики
Научитесь обеспечивать стабильность и надёжность систем с помощью методов SRE. Изучите принципы наблюдаемости и мониторинга, освойте управление инцидентами. Узнайте, как применять DORA-метрики для повышения эффективности работы.
Планируется
Старт потока
Преимущества
Создавай надежные системы на высоких скоростях
Внедри в свою работу SRE-подходы, чтобы обеспечить баланс между скоростью разработки и надежностью систем.
Выходи на новый уровень оптимизации кода!
Изучи DORA-метрики для оценки эффективности процессов разработки и эксплуатации.
Что такое SRE и его роль в стабильности системы? Как SRE помогает балансировать между скоростью разработки и стабильностью системы.
Принципы SRE: SLO, SLA, SLI — как они помогают управлять надёжностью систем.
Баланс между надёжностью и скоростью изменений: как использовать SRE-подходы для оптимального развертывания.
Основные метрики для мониторинга (latency, error rate, throughput, saturation): настройка ключевых метрик для управления производительностью и устойчивостью системы.
Логи и tracing: как использовать логи и распределённое tracing для диагностики проблем в микросервисах.
Построение alerting-систем: как настроить alerting так, чтобы минимизировать ложные срабатывания и обеспечить своевременные уведомления.
Метрики, логи, tracing как основные компоненты observability: создание системы, которая позволяет прогнозировать и решать проблемы до их появления.
Observability для микросервисов: как настроить системы мониторинга и визуализации для сложных распределённых архитектур.
Инструменты observability: Prometheus, Grafana, Jaeger, Loki — как настроить эффективный мониторинг и визуализацию данных.
DORA-метрики: MTTR (Mean Time to Recovery), CFR (Change Failure Rate), Deployment Frequency, Lead Time for Changes — ключевые метрики, которые оценивают эффективность процессов разработки и эксплуатации.
Использование MTTR и CFR для повышения надёжности: как анализировать и улучшать процессы на основе этих показателей.
Связь DORA-метрик с observability: как наблюдаемость помогает анализировать и оптимизировать процессы разработки.
Цикл жизни инцидента: от обнаружения до устранения. Как правильно организовать процесс управления инцидентами для минимизации простоя.
Постмортемы: как анализировать инциденты и внедрять улучшения на основе анализа корневых причин, чтобы предотвратить повторные проблемы.
Настройка систем мониторинга и логирования
Создание алертов и дашбордов
Реакция на инциденты в реальном времени
Постмортемы и анализ корневых причин
Оптимизация процессов с помощью DORA-метрик
Возможна рассрочка у банков партнеров
150 000 рублей
Стоимость
Для бронирования места оставьте заявку в форме и оплатите бронирование (которое пойдёт в счёт оплаты курса)