Мониторим активные сессии PostgreSQL 10 как в Oracle
Данный инструмент написан из спортивного интереса, когда мною было обнаружено, что вьюха pg_stat_activity в PostgreSQL 10 имеет поля wait_event_type и wait_event, очень похожие по сути на оракловые wait_class и event из v$session.
Активно работая в данный момент с программой ASH-Viewer от akardapolov мне стало любопытно — насколько сложно переписать этот продукт под Postgres. Учитывая, что я не профессиональный разработчик, было не просто, но очень интересно. По ходу дела даже нашёл, как мне кажется, пару значительных багов, которые проявляются и в оригинальной программе для Oracle, по кр.мере для Standard Edition.
Принципы работы PASH-Viewer:
Не нужны никакие расширения. Берём данные исключительно из встроенной вьюхи pg_stat_activity.
Раз в секунду делается запрос активных сессий:
SELECT current_timestamp, datid, datname, pid, usesysid,
coalesce(usename, backend_type, 'unknown') as usename,
coalesce(client_hostname, client_addr::text, 'localhost') as client_hostname,
application_name, wait_event_type, wait_event, state, backend_type, query
from pg_stat_activity
where state='active'
and pid != pg_backend_pid();
Раз в 15 секунд данные за последние 15 снимков усредняются и выводятся на график.
SQL id, который нужен для группировки запросов в разделе Top SQL, я генерирую сам, он не имеет никакого отношения к queryid из pg_stat_statements. Я думал, как использовать queryid, но к сожалению не нашёл способа сопоставить запросы из этих двух представлений. Было бы здорово, если бы разработчики добавили поле queryid в pg_stat_activity.
SQL id = первые 13 символов от md5 (нормализованный текст запроса).
Нормализованный текст запроса — это запрос, в котором удалены символы новых строк и лишние пробелы, а литералы заменены на $1, $2 и т.д… Написать хорошую функцию нормализации запроса для меня было сложно. Я написал плохую. Текст привожу, но вы его пожалуйста не смотрите, а то мне стыдно. Лучше пришлите хорошую.
public static String NormalizeSQL(String sql) {
sql = sql.replaceAll("\\(", " ( ");
sql = sql.replaceAll("\\)", " ) ");
sql = sql.replaceAll(",", " , ");
sql = sql.replaceAll("=", " = ");
sql = sql.replaceAll("=", " = ");
sql = sql.replaceAll("<", " < ");
sql = sql.replaceAll(">", " > ");
sql = sql.replaceAll(">=", " >= ");
sql = sql.replaceAll("<=", " <= ");
sql = sql.replaceAll("\\n", " ");
sql = sql.replaceAll(";", "");
sql = sql.replaceAll("[ ]+", " ");
sql = sql.toLowerCase().trim();
String[] array = sql.split(" ", -1);
int bvn = 0;
String nsql = "";
for (int i = 0; i < array.length; i++) {
if (array[i].matches("-?\\d+(\\.\\d+)?")) {
bvn++;
array[i] = "$" + bvn;
} else if ((array[i].charAt(0) == '\'') && (array[i].charAt(array[i].length() - 1) == '\'')) {
bvn++;
array[i] = "$" + bvn;
}
nsql += array[i] + " ";
}
return nsql;
}
С планом выполнения запроса было сложно. Это к Oracle ты приходишь и говоришь «Дай мне план для sqlid=…», и он тебе отвечает — «Тебе самый последний, или за вчера, или показать все за последний месяц со статистикой выполнения по каждому?». А PostgreSQL тебе отвечает — «А что такое sqlid?».
Поэтому для запросов вида SELEСT/UPDATE/INSERT/DELETE посылаем в БД команду EXPLAIN и сохраняем результат локально. Делаем это не чаще 1 раза в час.
И работает это только в том случае, если запрос выполнялся в той же БД, к который вы подключились (указывается при настройке соединения).
EXPLAIN работает, только если вы подключились к БД под суперюзером (postgresql). Но многие наверное не захотят так рисковать. Поэтому можно создать специального юзера для мониторинга. Будет работать всё, кроме отображения планов.
CREATE USER pgmonuser WITH password 'pgmonuser';
GRANT pg_monitor TO pgmonuser;
Скачать тут
PASH-Viewer-0.2.zip — бинари
PASH-Viewer-20180606.src.7z — исходники
Спасибы и приветы:
Александру Кардаполову за ASH-Viewer.
Антону Глушакову за консультацию и тестирование.
Дмитрию Рудопысову за то, что объяснил, как компилировать и запускать скачанный с github проект.
Ещё слайды: