[Перевод] Общий обзор методов резервного копирования

j7whsiedmvq88vdnhpi9eh26z-s.png


Решения по резервному копированию для окружений VMware и Hyper-V отличаются многими аспектами, которым можно посветить целую обширную статью. В этой же публикации мы разберем только один из этих аспектов — типы бэкапа. Ниже представлен краткий обзор каждого из традиционных (полный, инкрементальный и дифференциальный) и более свежих (бесконечно-инкрементальный и синтетический) методов резервного копирования, а также их модификаций (зеркальный, обратно-инкрементальный, смарт-бэкап и непрерывный). Это позволит вам понять, чем они отличаются, и какие преимущества каждый из них обеспечивает.

▍ Полный бэкап


Нетрудно догадаться по названию, что этот тип резервного копирования ведет к созданию полной копии исходного набора данных. Он считается лучшим вариантом защиты в плане простоты и скорости восстановления. Тем не менее ввиду больших объемов копируемых данных в данном случае процесс оказывается ощутимо более времязатратным в сравнении с другими типами бэкапа. Помимо этого, полный бэкап при каждом выполнении оказывает существенную нагрузку на сеть, тем самым препятствуя выполнению рабочих операций инфраструктуры. К тому же регулярное выполнение полного копирования требует огромных запасов хранилища в резервном репозитории.

vavsy21g2nqv3qntkeobaj7jg0w.png

В связи с этим большинство организаций делают полный бэкап лишь периодически, совмещая его с другими техниками. При таком подходе полноценное копирование обычно становится стартовой точкой, за которой следуют уже дополнительные методы.

Преимущества:

  • быстрое восстановление данных;
  • более удобное управление хранилищем, поскольку весь набор данных хранится в одном файле копии.


Недостатки:

  • занимает много времени;
  • требует большого запаса хранилища для размещения всех регулярно создаваемых копий;
  • поскольку каждый файл бэкапа содержит весь набор данных (которые нередко являются конфиденциальными), под удар может попасть весь бизнес, если к ним получат доступ злоумышленники. Хотя этого риска можно избежать с помощью шифрования, если выбранное вами решение такую опцию поддерживает.


▍ Инкрементальный бэкап


Инкрементальные бэкапы (англ.) позволяют сократить количество времени и сетевую нагрузку, необходимые для выполнения последовательного полного копирования данных. Стартовой точкой в таком случае выступает один полный бэкап, после чего с каждым последующим инкрементом копируются только те блоки данных, которые изменились с момента последнего бэкапа. Затем, спустя некоторый промежуток времени, определяемый политикой хранения резервных копий, создается очередной полный бэкап, также сопровождаемый инкрементами.

Чтобы лучше представить этот процесс, предположим, что вы сделали полную копию данных в понедельник, запустив на остаток недели инкрементальный бэкап. В таком случае во вторник будут скопированы только те данные, которые изменились с понедельника. В среду скопируются те, что изменились со вторника, и так далее. Инкрементальный бэкап можно выполнять с любой подходящей вам частотой, поскольку каждый раз в резервный репозиторий копируются только произошедшие изменения.

f0p30eqqcrp5vfpcivdfqcam1cq.png

Инкрементальные бэкапы быстры и требуют намного меньше дискового пространства, если сравнивать с полными. Однако при этом процесс восстановления оказывается весьма длительным, так как приходится восстанавливать сперва изначальный полный бэкап, а затем всю следующую за ним цепочку инкрементов. Если один из инкрементов будет отсутствовать или окажется поврежден, полноценно восстановить данные не получится.

Преимущества:

  • задачи резервного копирования выполняются быстро, поскольку в бэкап отправляются только изменения;
  • требуется меньше пространства хранилища;
  • частота выполнения может быть любой, каждый инкремент выступает отдельной точкой восстановления;


Недостатки:

  • медленный процесс полного восстановления, поскольку необходимо сначала вернуться к изначальному полному бэкапу, а затем пройтись по всем следовавшим за ним инкрементам;
  • успешное восстановление данных зависит от целостности всех инкрементов в цепочке.


▍ Дифференциальный бэкап


Дифференциальный бэкап (англ.) — это промежуточное решение между полным бэкапом и инкрементальным. По аналогии с инкрементальным, здесь также стартовой точкой выступает полное резервное копирование, за которым следует внесение в бэкап только изменений.

Отличие же в том, что изменения вносятся не с момента последнего копирования, а с момента первичного полного бэкапа. То есть начальный бэкап в этом случае оказывается постоянной точкой обращения для всех следующих за ним этапов резервного копирования. Такой подход позволяет быстрее восстанавливать данные в сравнении с инкрементальным, поскольку требует в этом процессе только двух компонентов — начального полного бэкапа и последнего дифференциального.

zppxwbqprgvxhiywrw5oxxne1uc.png

В плане скорости резервного копирования/восстановления этот метод находится где-то между полным и инкрементальным методами:

  • эта операция быстрее полного копирования, но медленнее инкрементального;
  • процесс восстановления происходит медленнее, чем при полном бэкапе, но быстрее, чем при инкрементальном.


Необходимое пространство хранилища в данном случае, по крайней мере на определенный период, будет меньше, чем для полного бэкапа, но больше, чем для инкрементального. Хитрость в том, что с течением времени инкременты измененных данных будут увеличиваться и в итоге могут начать требовать даже больше места и времени, чем стандартные полные копии.

▍ Зеркальный бэкап


Этот тип аналогичен полному бэкапу. Он подразумевает создание точной копии исходного набора данных, но в хранилище при этом сохраняется только их последнее представление без отслеживания различных версий файлов. В противоположность прочим типам бэкапов все отдельные файлы здесь сохраняются в одном сжатом/зашифрованном контейнере, но по отдельности, соответственно их расположению в исходном хранилище. Это позволяет получать к ним прямой доступ без выполнения восстановления. Исходные данные «зеркалируются» в бэкапе, после чего в зеркало копируются только измененные файлы.

Очевидно, что подобный метод, несмотря на все преимущества вроде быстрого восстановления или прямого доступа к отдельным файлам, имеет свои недостатки: высокие требования к объему хранилища, высокий риск неавторизованного доступа, а также повреждение или ненадлежащее использование данных.

При этом зеркальные бэкапы рекомендуется применять с осторожностью. Когда файл в исходных данных удаляется, этот же файл удаляется и в «зеркале». То есть любое неблагоприятное изменение, произошедшее в исходном хранилище вследствие человеческой ошибки, случайности или вредоносных действий, может вызвать тот же эффект в зеркале.

▍ Реверсивный инкрементальный бэкап


Этот метод аналогичен прочим типам бэкапа и начинается с выполнения полного копирования. Затем все последующие инкременты «внедряются» в этот полный бэкап, формируя его актуальную полноценную форму, представляющую последнюю версию набора данных. Кроме того, все замещаемые при этом блоки данных также сохраняются, следуя за постоянно обновляемым полным бэкапом. Это позволяет откатываться к недавним полноценным резервным копиям в случаях, когда требуется восстановить более старые версии данных.

foccu-qf9l503_kyh90hdwl_jmg.png

Преимущество такого реверсивного метода заключается в высокой скорости восстановления, поскольку для него используется последняя полная резервная копия.

▍ Смарт-бэкап


Смарт-бэкап (умный бэкап) представляет собой комбинацию полного, инкрементального и дифференциального бэкапов. В зависимости от задач резервного копирования и доступного пространства этот метод обеспечивает эффективное резервное копирование данных, параллельно управляя хранилищем. Для этого он выполняет операции бэкапа, очистки и слияния на основе заданного «умного» паттерна. Принцип работы этого метода продемонстрирован в таблице ниже.
Использование этого типа резервного копирования избавляет от беспокойства по поводу недостатка места в хранилище, так как он исключает риск его исчерпания.

▍ Непрерывная защита данных (CDP)


В отличии от прочих стратегий резервного копирования, выполняющихся на периодической основе, непрерывная защита данных по аналогии с зеркальным методом логирует каждое изменение в исходном наборе данных. Разница в том, что в CDP по журналу изменений можно откатиться назад для восстановления прошлых версий представления данных.

▍ Синтетический полный бэкап


Синтетический полный бэкап (англ.) имеет много общего с реверсивным инкрементальным методом. Отличаются же они способом манипуляции данными. Синтетическое резервное копирование начинается с выполнения традиционного полноценного бэкапа, сопровождаемого серией инкрементальных. В определенный момент инкрементальные бэкапы объединяются и применяются к имеющемуся полному, синтезируя последнюю полноценную резервную копию в качестве новой стартовой точки.

rbnlgwewjhkupoou8mex65-p-kg.png

Этот метод обладает всеми достоинствами стандартных способов резервного копирования, но занимает при этом меньше времени и места на диске.

Преимущества:

  • высокая скорость операций резервного копирования и восстановления;
  • более эффективное управление пространством хранилища;
  • низкие требования к объему хранилища;
  • низкая нагрузка на сеть.


▍ Бесконечно-инкрементальный бэкап


Бесконечно-инкрементальный бэкап (англ.) отличается от обычного инкрементального организацией данных и их обработкой. По аналогии со всеми описанными выше методами, он начинается с первичного полноценного бэкапа, используемого в качестве ориентира для отслеживания изменений. После этого выполняются только инкрементальные обновления резервной копии без периодического повтора полноценного бэкапа, что и объясняет название метода.

Для более наглядного представления предположим, что вы сделали полный бэкап в субботу. Начиная со следующего дня, на каждодневной основе выполняется инкрементальное резервное копирование. В воскресенье в исходных данных создаются два новых блока, A и B. В понедельник блок А удаляется, и создается блок С. Во вторник удаляется блок В, и создается блок D.

При этом бесконечно-инкрементальная система бэкапа отслеживает все ежедневные изменения, удаляя повторяющиеся блоки данных для экономии пространства в резервном репозитории. В то же время в точки восстановления добавляются необходимые ссылки, указывающие на связанные блоки данных и последовательность восстановления.

p9qkh4kzfhlhoyqm5_uc2qcc1fw.png

В зависимости от конкретной политики хранения бэкапов, после создания определенной серии инкрементальных копий устаревшие бэкапы и точки восстановления удаляются, освобождая место в резервном хранилище.

Преимущества бесконечно-инкрементального бэкапа аналогичны преимуществам синтетического:

  • высокая скорость операций резервного копирования и восстановления;
  • более эффективное управление пространством хранилища;
  • низкие требования к объему хранилища;
  • низкая нагрузка на сеть.


▍ Обобщение


С одной стороны, сложно обозначить конкретно хорошие или плохие типы резервного копирования. Для этого необходимо учитывать, какой из них лучше всего подойдет под требования именно вашей организации, определяемые политиками защиты данных, доступным объемом хранилища, ресурсами, а также пропускной способностью сети, соглашениями на уровне сервисов и прочими факторами.

С другой стороны, бесконечно-инкрементальный и синтетический полный методы обеспечивают явно более современный процесс резервного копирования, являясь последними техниками защиты данных, разработанными под нужды большинства организаций.

sz7jpfj8i1pa6ocj-eia09dev4q.png

© Habrahabr.ru