Этюд по PITR штатными средствами PostgreSQL
В короткой заметке описан cценарий Point In Time Recovery с использованием средств из стандартной поставки PostgreSQL версии 11.
Для создания базовой резервной копии используется штатная утилита — pg_basebackeup.
Для потоковой архивации файлов WAL используется штатная утилита — pg_receivewal
Общий сценарий довольно подробно описан в документации Непрерывное архивирование и восстановление на момент времени (Point-in-Time Recovery, PITR), однако довольно общими фразами. Поэтому при попытке реализовать на практике возникли некоторые, хотя и вполне преодолимые шероховатости.
Посмотрел по поиску на Хабре, вроде не нашел статей о PITR штатными средствами. Так, что может быть кому то пригодится, в качестве шаблона-рыбы. Или студентам, как лабораторка ;-)
Конфигурация для тестирования — самая простая, один сервер RedHat Linux, один сервис PostgreSQL (pgdata=/postgres/pgdata, waldir=/postgres/waldir), pg_receivewal запускается от имени postgres, заполнение тестовыми данными не уточняется и оставлено на личноe усмотрение.
Порядок действий по пунктам
1. Создать папки хранения и добавить скрипты
mkdir -p /postgres/wal_arc
chown postgres:postgres /postgres/wal_arc
mkdir -p /postgres/backup
chown postgres:postgres /postgres/backups
mkdir -p /postgres/scripts
chown postgres:postgres /postgres/scripts
Cкрипты в папке /postgres/scripts
#!/bin/bash
# pg_receivewal.sh
# /postgres/scripts/
pg_receivewal --no-loop --synchronous --slot=slot_receivewal --directory=/postgres/wal_arc --verbose --host=localhost > /postgres/scripts/pg_receivewal.log 2>&1
#!/bin/bash
# rename.sh
# /postgres/scripts/
for f in /postgres/wal_arc/*.partial;
do
mv -- "$f" "${f%.partial}"
done
exit 0
2. Запустить непрерывное архивирование WAL-файлов
Настроить файл .pgpass, для запуска pg_receivewal без пароля:
vi ~/.pgpass
localhost:5432:*:postgres:postgres
chmod 0600 ~/.pgpass
Настроить сервис для запуска pg_receivewal.Пользователь root.
##########################################################
# /etc/systemd/system/
# pg_receivewal.service
[Unit]
Description=Receiving for WAL stream
[Service]
Type=simple
WorkingDirectory=/postgres/scripts
User=postgres
Group=postgres
ExecStart=/postgres/scripts/pg_receivewal.sh
[Install]
WantedBy=multi-user.target
Запускаем сервис.Пользователь root
systemctl daemon-reload
systemctl start pg_receivewal.service
Проверяем.Пользователь root.
systemctl status pg_receivewal.service
В случае успешного старта получаем ответ
● pg_receivewal.service - Receiving for WAL stream
Loaded: loaded (/etc/systemd/system/pg_receivewal.service; disabled; vendor preset: disabled)
Active: active (running) since...
3. Заполнение тестовыми данными
Любым способом, на усмотрение читателя.
4. Создание базовой резервной копии
Все стандартно и тривиально:
pg_basebackup -D /postgres/backups/ --format=tar -Xs --progress --verbose
Получаем ответ о успешном выполнении:
pg_basebackup: initiating base backup, waiting for checkpoint to complete
pg_basebackup: checkpoint completed
…
pg_basebackup: base backup completed
5. Имитируем катастрофу БД
Остановить сервер PostgreSQL любым способом.
Удалить папки файлов данных и WAL:
rm -rf /postgres/pgdata
rm -rf /postgres/waldir
6. Восстановление БД
Создать папки файлов данных и WAL:
mkdir /postgres/pgdata
chown postgres:postgres /postgres/pgdata
chmod 750 /postgres/pgdata
mkdir /postgres/waldir
chown postgres:postgres /postgres/waldir
chmod 750 /postgres/waldir
Восстановить файлы данных из базовой резервной копии:
cd /postgres/backups
cp base.tar /postgres/pgdata
cd /postgres/pgdata
tar -xvf base.tar
rm base.tar
rm -r pg_wal
ln -s /postgres/waldir pg_wal
В папке /postgres/wal_arc имеется неполный файл WAL (с расширением partial), нужно его переименовать, на случай если точка восстановления окажется в незаполненном файле WAL. Переименовать файл — вручную или скриптом rename.sh:
/postgres/scripts/rename.sh
Для восстановления на заданную точку во времени необходимо подготовить файл recovery.conf:
restore_command = 'cp /postgres/wal_arc/%f %p'
recovery_target_time = '*****'
recovery_target_action=promote
recovery_target_time задается требуемая временная точка восстановления в формате timestamp.
Запустить сервис PostgreSQL любым доступным способом.
Файл recovery.conf переименован в recovery.done?
cd /postgres/pgdata
ls -la recovery.done
Если файл переименован-восстановление прошло успешно.
Дополнительно полезно убедиться, что лог файл содержит следующие строки:
starting point-in-time recovery to ...
database system is ready to accept connections
В случае успешного восстановления перезапускаем потоковую архивацию файлов WAL:
pg_receivewal --create-slot --slot=slot_receivewal --verbose
Пользователь root
systemctl start pg_receivewal.service
Итог
В самом простом сценарии, База Данных восстановлена на требуемую точку во времени.