Применение статистического анализа для определения причин деградации производительности СУБД — часть 2
Продолжение Применение статистического анализа для определения причин деградации производительности СУБД
Часть 2 — ложное оповещение о деградации производительности
Нужно ли открывать инцидент о деградации производительности СУБД ?
На первый взгляд имеется, что-то похожее на классическую аномалию:
Сдвиг
Сдвиг в данных временного ряда
Задача обнаружения сдвига в данных неплохо исследована, поскольку встречается в обработке сигналов.
Источник: Обнаружение аномалий в данных сетевого мониторинга методами статистики / Хабр (habr.com)
Порядок анализа
1.Статистические показатели производительности СУБД
14:05 — 14:41 — Высокая производительность
Статистика 14:05–14:11
Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.
14:41 — 15:11 — Изменение производительности
Статистика 14:41–15:11
Важная деталь: Нагрузка — постоянная.
15:11 — 15:45 — Низкая производительность
Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.
Выводы
Нагрузка на СУБД в период низкой производительности СУБД (15:11–15:45) — не изменилась
В период изменения производительности СУБД (14L41–15:11) — обратная корреляция между количество активных сессий и производительностью СУБД — отсутствует. Или другими словами — снижение нагрузки на СУБД коррелируется со снижением производительности СУБД.
Распределение производительности СУБД в период высокой нагрузки (14:05–14:41) и низкой нагрузки (15:11–15:45) — симметричное.
Распределение производительности СУБД в период 14:05–14:41
Частотная диаграмма распределения производительности СУБД в период 14:05–14:41
Распределение производительности СУБД в период 15:11–15:45
Частотная диаграмма распределения производительности СУБД в период 15:11–15:45
2.Анализ ожиданий и производительности СУБД
14:05 — 14:41 — Высокая производительность
Ожидания и корреляция по SQL запросам в период 14:05 — 14:41
14:41 — 15:11 — Изменение производительности
Ожидания и корреляция по SQL запросам в период 14:41–15:11
15:11 — 15:45 — Низкая производительность
Ожидания и корреляция по SQL запросам в период 15:11–15:45
Выводы
Корреляция и состав ожиданий в период высокой (14:05–14:41) и низкой (15:11–15:41) — производительности — полностью не совпадает
Общий вес по событиям ожидания в период низкой (15:11–15:41) производительности существенно ниже, чем в период высокой (14:05–14:41) .
Вывод и общие итоги
Снижение производительности СУБД в период 15:11 — 15:45 вызвано изменением характера запросов к СУБД и не является инцидентом по деградации производительности СУБД.
Использование статистического анализа позволило резко снизить время на поиск возможным причин инцидента производительности.
Симметричное распределение производительности СУБД можно с некоторой долей уверенности считать признаком штатной работы СУБД.