Наблюдаемость, или Как не искать чёрную кошку, когда её нет - КИТ 2024
HTML-код
- Опубликовано: 29 окт 2024
- Спикер: Илья Рогачев, приглашённый спикер
Когда начинаешь заводить продуктовые инсталляции, сталкиваешься с первыми инцидентами - это можно сравнить с полётом в состоянии нулевой видимости без приборов.
На лекции поговорим о том, что уменьшит MTTD, MTTR и сэкономит нервные клетки - о наблюдаемости и прозрачности в сложных системах ПО.
Спасибо!
00:00:00 Ожидание начала трансляции
00:03:40 Начало. Содержание
00:04:37 Зачем
00:13:15 Столпы наблюдаемости. Логи
00:21:37 Хорошие практики
00:29:45 Severity level
00:34:22 Метрики
00:41:53 Пример сценаря
00:43:19 Распределённые трассировки
00:49:00 Проблемы. OpenTelemetry. Continuous profiling. События.
01:01:45 Перерыв
01:15:05 Пайплайны поставки
01:24:12 Эталонные схемы и реальность
01:27:33 Визуализация данных
01:46:45 Построение алертов и эскалаций, SLI, SLO, SLA
01:53:30 Что может пойти не так
01:56:43 Что важно сделать чтобы спать спокойно
02:04:30 Вопросы
02:14:00 Завершение трансляции
Почему вы модуль SRE назвали Курс информационных технологий?))
Сколько ни читаю про 4 золотых сигнала, все равно кажется, что под saturation там имеется в виду utilization. Не встретил ни разу ничего про отложенную в очередь работу (для CPU). Всегда речь идет про нагруженность ресурса в процентах от максимума, что больше похоже на utilization.