Real-time мониторинг тормозящих запросов PostgreSQL своими руками за полчаса10.08.2021 14:31

В моей практике не раз были ситуации, когда хотелось посмотреть, какие именно запросы долго тупили в базе в определённый (конкретный) момент времени. А может, запросы не тупили, но каких-то запросов было слишком много.

Ключевое слово — в конкретный момент времени. Например, база непонятно от чего напряглась на 5 минут, потом всё само рассосалось, и очень хочется знать, почему. Отчёты за сутки, присылаемые dba на основе pg_stats_statements, не всегда проясняют ситуацию. Другие графики и логи могут помочь. Но всё же хочется не гадать на кофейной гуще, а конкретно посмотреть, что такому-то запросу в такое-то время было плохо, или его было много.

Можно, конечно, подключить системы, а ля okmeter, но okmeter стоит денег. Да ещё и отсылает запросы в чужое облако — что, понятно, не в каждой организации можно считать безопасным.

На удивление, сделать такой мониторинг самому занимает всего полчаса времени, буквально с помощью нескольких строк Go-кода и палок.

Как же это сделать?

Часто дёргаем pg_stat_statements

Если кто вдруг не знает, в стандартной поставке Постгреса есть расширение для сбора статистики по запросам, называется pg_stat_statements. Чтобы его включить, нужно добавить в конфиг shared_preload_libraries='pg_stat_statements' и потом выполнить SQL-команду CREATE EXTENSION pg_stat_statements;. Это расширение собирает данные по запросам, собирая стату в оперативной памяти в сишной структуре. Практически без оверхеда. Посмотрите в мануале, какую информацию по запросам оно может выдать. Забирать стату просто — достаточно сделать запрос,

SELECT [что вас интересует] FROM pg_stat_statements;

и вы получите всю инфу по всем SQL-запросам.

Всё это здорово, но проблема заключается в том, что расширение копит информацию до тех пор, пока не сделаешь ему reset (pg_stat_statements_reset ()). Причём этот ресет делается только из-под суперпользователя. Неудобно, и это получается какой-то глобальный стейт. Мало ли кто, когда и зачем это заресетит. Например, dba делает себе отчёт за сутки и отсылает по почте, чтобы понять, что в целом в системе можно подкрутить.

Поэтому мы пойдём другим путём. Чтобы понять, что происходит в каждый небольшой интервал времени, мы будем дёргать pg_stat_statements каждые несколько секунд и смотреть, что изменилось с прошлого вызова. Не буду приводить весь код, но суть примерно такая:

func (w Watcher) Watch() error {

    previousStatStatements, err := w.getStatStatements()
    if err != nil {
        return err
    }

    // бесконечный цикл
    for true {
        time.Sleep(3 * time.Second)
        currentStatStatements, err := w.getStatStatements()

        if err != nil {
            return err
        }

        // записываем изменения
        w.logChanges(currentStatStatements, previousStatStatements)

        previousStatStatements = currentStatStatements
    }
    return nil
}

В частности, будем смотреть на поле calls (количество вызовов запроса) и total_exec_time (суммарное время, потраченное на все вызовы запроса). Если для какого-то запроса calls увеличился с прошлого раза, значит, в этот интервал времени был этот запрос. А по разнице с предыдущими значениями calls и total_exec_time мы можем понять, сколько именно таких запросов было, и сколько времени это заняло. Заодно можно посчитать и среднее время запроса за наш небольшой интервал. Ну и куда-то надо это сохранить — давайте для начала просто выведем информацию в лог:

func (w Watcher) logChanges(currentStatStatements map[string]PgStatStatementsRow, previousStatStatements map[string]PgStatStatementsRow) {
    currTime := time.Now()
    for query, curr := range currentStatStatements {
        if strings.Contains(query, "pg_stat_statements") {
            continue
        }
        prev, exists := previousStatStatements[query]
        if !exists || prev.Calls > curr.Calls {
            prev = PgStatStatementsRow{Calls: 0, TotalTime: 0}
        }

        if curr.Calls == prev.Calls {
            continue
        }

        timeDiff := curr.TotalTime - prev.TotalTime
        countDiff := curr.Calls - prev.Calls
        execMeanTime := timeDiff / float64(countDiff)

        w.log.Info().
            Bool("is_sql_stats", true).
            Time("time", currTime).
            Float64("time_diff", timeDiff).
            Uint64("count_diff", countDiff).
            Float64("exec_mean_time", execMeanTime).
            Msg(query)
    }
}

Записываем в лог и настраиваем отображение

Остаётся эту информацию куда-то сохранить. Но вообще-то, если честно, мы всё уже сохранили. Практически в любой мало-мальски серьёзной системе есть какой-то сбор логов и удобное отображение. В проектах, над которыми мы работаем в Каруне, обычно stdout контейнера ловится агентом и отправляется в общее хранилище. Т.е. ничего дополнительно изобретать не надо. У нас, по сути, достаточно просто выплюнуть json с информацией, и результат можно смотреть в грейлоге с удобным ui и различными визуальными свистелками.

Просто смотреть на бесконечные логи — это, конечно, грустно. Нужно сделать dashboard.

Создать дашборд — дело пары минут. Покажу, как.

Жмём кнопку «Create New Dashboard»

Нажимаем слева плюсик и выбираем Aggregation

Затем Edit. Откроется окошко, в котором надо выбрать параметры агрегации и отображения.

Rows — это поле, по которому будем агрегировать, т.е. сам sql-запрос. В моём случае оно после разбора джейсона попадает как _message.

Metrics — это агрегационные функции. Нам будут интересны суммарное время выполнения запроса (sum (_time_diff)), сколько раз выполнялся (sum (_count_diff)) и, например, максимальное среди средних времён, так сказать (max (_exec_mean_time))

В итоге имеем примерно такой результат, его можно получить для любого интервала времени:

Если заменить тип отображения с Data Table на Pie Chart, то можно строить интересные картинки:

Можно делать и другие вещи. Всё зависит от вашей фантазии и возможностей грейлога. Например, можно выбрать интервал «последние 5 минут» и нажать кнопку автообновления, чтобы медитировать на то, что происходит в реальном времени.

Что если нет грейлога?

Я описал простейший случай, как сделать мониторинг на коленке за полчаса, имея только грейлог, который уже и так есть в системе. Разумеется, можно это делать и по-другому. Использовать кибану, например. Или, возможно, стоит писать метрики в prometheus, и отображать в grafana. Да как угодно.

Если у вас совсем ничего такого нет, ну можно тогда выводить информацию не в лог, а писать куда-нибудь в базу данных, а потом селектами информацию агрегировать. И написать свой UI, куда это красиво выводить и т.д.

Вывод

В общем, ничего сложного тут нет. И не всегда надо ставить или покупать особый софт: можно напилить небольшой велосипедик, не особо напрягаясь.

А потом можно его и доработать: в pg_stat_statements много информации, которую можно получить — не только количество и время.

Исходный код (громко сказано) можно посмотреть здесь.