Backup&Recovery: поточная и умная дедупликация, снапшоты и вторичное хранение
Резервное копирование должно осуществляться на удаленную площадку, и, кроме того, должны быть доступны функции управления привилегиями в приложениях и аварийное восстановление данных по запросу. Сегодня предлагаем посмотреть, насколько современные решения отвечают таким требованиям, какие компании и стартапы существуют на этом рынке и какие технологии они используют.
/ Flickr / Rob Brewer / CC-BY
Rubrik
Rubrik — представляет собой конвергентную систему управления данными для гибридных облаков. Платформа дает возможность делать автоматические бэкапы, мгновенное восстановление, репликации на удаленные площадки и архивировать данные, а также может легко масштабироваться горизонтально. Возможности data management включают управление жизненным циклом данных от подготовки к архивации, хранения разных версий данных, обеспечения их целостности до выполнения глобальной дедупликации и сжатия.
Но самое важное преимущество Rubrik заключается в том, что он заменяет собой множество отдельных элементов (резервный сервер, резервный прокси-сервер, инструменты для репликации и дедупликации, акселератор, дисковая память и внешнее хранилище), необходимых для резервного копирования и восстановления. Для небольшой среды хватит одного устройства с четырьмя узлами, но даже при увеличении количества блоков, управлять ими можно как одной системой. Основатели стартапа имеют опыт работы в инвестиционном фонде Lightspeed, рекламной фирме Кремниевой долины Rocketfuel и даже Google.
Pure Storage и Cohesity
Еще одно решение в области резервного копирования и хранения данных предлагает этот союз двух компаний. Pure Storage, основанная еще в 2009 году, является производителем флэш-накопителей (all-flash), а его основатели — бывшие сотрудники Veritas Software и Yahoo. Стартап 2013 года Cohesity представляет собой гиперконвергентную платформу для вторичного хранения данных. Основателем Cohesity является Мохит Арон (Mohit Aron), бывший сотрудник Google и соучредитель другого популярного стартапа на рынке гиперконвергентной инфраструктуры Nutanix.
Это решение позволяет пользователям хранить более старые снимки файловых систем во вторичном хранилище Cohesity, которое интегрируется с AWS, Microsoft Azure и Google Cloud. А последние снапшоты — в Pure Storage, который обеспечивает более надежную защиту данных. Также система обеспечивает эффективное многоуровневое хранение на Pure Storage и Cohesity с использованием API-интерфейса хранения снимков, автоматизацию создания и хранения снимков на двух платформах с использованием общих политик и создание согласованных с приложениями снимков, что сокращает время восстановления.
ClearSky Data
Стартап ClearSky Data помимо дедупликации, резервного копирования и аварийного восстановления предлагает многоуровневую систему хранения. Ее суть заключается в том, что кэш самых важных данных хранится на площади клиента. Менее важные, так называемые теплые данные, хранятся на развернутом локальном облаке в радиусе 200 километров от помещения компании. А холодные данные, к которым обращаются достаточно редко, хранятся на внешнем облаке Amazon S3.
Стартап использует специальное программное обеспечение и алгоритм, которые могут управлять данными и автоматически перемещать их между различными местами хранения на основе моделей использования, политики и требований заказчика. Пока компания функционирует только в нескольких городах США — в Бостоне, Филадельфии и Лас-Вегасе, но планирует расширяться.
Datrium
Стартап Datrium основали бывшие сотрудники EMC, VMware и Data Domain. Это конвергентная инфраструктура, которая предлагает аппаратное решение DVX и ПО для поддержки облачных хранилищ в дата-центрах. DVX использует серверную флэш-память для постоянного хранения, чтобы сконцентрировать функции хранения данных в ядре сервера. Datrium поддерживает серверные SSD-накопители корпоративного уровня и флэш-накопители клиентского класса. А программное обеспечение для управления флэш-памятью DVX сочетает в себе защиту данных при помощи массива RAID и сжатие данных на стороне хоста ESXi.
DVX обменивается данными через 10 Gigabit Ethernet-интерфейс (10 GbE) с устройством NetShelf, которое используется для вторичного хранения. Часть данных кэшируется на SSD, а часть направляется на NetShelf для обеспечения высокой доступности общего хранилища. Поточная дедупликация и сжатие данных выполняется на локальной флэш-памяти перед отправкой на NetShelf, который делает глобальную дедупликацию. Продукт должен заменить старые массивы хранения данных среднего уровня, которые почти исчезли с рынка.
Symantec NetBackup
Традиционные подходы к дедупликации довольно ресурсоемкие из-за отсутствия четкого представления о потоке данных: поиск границы файла с целью выявления дубликатов происходит путем сканирования всего потока данных по байту. То есть такие методы пытаются угадать оптимальный алгоритм дедупликации и вычислить размер двигающегося целевого блока за счет использования тяжелых ресурсов. Поэтому обычной дедупликации становится недостаточно.
Symantec NetBackup предлагает технологию V-Ray и умную дедупликацию, которые позволяют точно определять форматы данных и границы файлов. Поэтому оптимальный алгоритм дедупликации определяется автоматически. Удаление избыточных данных можно организовать ближе к источнику, что максимизирует преимущества дедупликации за счет снижения загрузки центрального процессора и памяти по сравнению с традиционным резервным копированием. Или ближе к получателю информации, чтобы не выделять отдельный сервер или место для хранения данных.
Datto и Open Mesh
Datto существует на рынке уже 10 лет: компании есть собственные разработки в области программного и аппаратного обеспечения, благодаря которым моментальные копии всей IT-системы клиента делаются каждые пять минут. Технология мгновенной виртуализации обеспечивает аварийное восстановление в течение нескольких секунд. В конце января этого года компания приобрела Open Mesh — беспроводную Wi-fi сеть, управляемую облачной платформой CloudTrax.
Это приобретение позволило Datto запустить сервис Datto Networking, который обеспечивает развертывание полных сетей за считанные минуты, непрерывность, масштабируемость и избыточность сети, постоянное подключение к Wi-Fi и аварийное переключение на 4G LTE. Интеллектуальные точки доступа формируют самоорганизующуюся, самовосстанавливающуюся и шифрованную mesh-сеть. И компании могут использовать такую сеть для подключения систем к клиентскому сервису Datto Networking Appliance. Основатель компании уверен, что Datto сможет создать достойную конкуренцию самым крупным поставщикам решений в этой области: Symantec, HP и EMC.
Primary Data
Израильско-американская компания Primary Data примечательна в первую очередь тем, что в ее команду входит Стив Возняк. Платформа DataSphere позволяет виртуализировать данные через global dataspace, поэтому управление охватывает локальный уровень хранения, а также публичные и частные облака. Клиенты могут создавать комплексную политику, которая регламентирует архивирование и аварийное восстановление и определяет, где будут размещаться данные: локально или в облачных системах хранения.
Возможности умного data management от DataSphere обеспечивают защиту данных на основе снапшотов, которая включает в себя облачную архивацию снимков и устаревших данных. Платформа снижает общую стоимость владения, так как клиентам не требуется приобретать отдельные решения для архивации, миграции данных и аварийного восстановления. Primary Data также может объединять системы хранения данных EMC в единую среду, масштабируя решения EMC Data Lake через различные платформы хранения данных EMC.
P.S. О чем еще мы пишем в блоге IaaS-провайдера 1cloud:
- Немного о VPN: Краткий обзор программных реализаций
- Личный опыт: Как мы автоматизировали работу с DNS-записями в хостинг-панели
- Нюансы соглашения об уровне оказываемых услуг
- Зачем покупать SSL-сертификат
- Тренды облачной безопасности