Распространение процесса дедупликации

Несмотря на то, что дедупликация информации является относительно легким способом консолидирования систем хранения данных для компаний, технология все же пока не привлекла особого внимания ИТ-менеджеров. По данным Gartner Inc., только 30% корпораций применяли какие-либо дедупликационные методики.

В Gartner считают, что эти технологии могут сократить необходимость хранения данных в соотношении в среднем с 20:1 до 30:1 - это гораздо меньше, чем утверждения вендоров о 200:1 до 300:1, - но, все-таки, вполне достаточно, чтобы значительно снизить требования к пропускной способности сети и отложить закупку оборудования для хранения информации, максимально используя для этого то, что есть.

Аналитик из Gartner Валдис Филкс предположил, что, несмотря на потенциальные выгоды, ИТ-менеджеры неохотно интересуются этими технологиями из-за высоких затрат на их внедрение.

"Дедупликация становится очень модной тенденцией и может помочь сэкономить средства, но компании, с представителями которых я беседовал, сразу теряют к ней интерес из-за высокой закупочной цены", - рассказывает Филкс.

Проще говоря, дедупликация данных включает в себя удаление избыточной информации. Хэш-алгоритмы маркируют блоки данных с помощью уникальных номеров, и эти номера сравниваются таким образом, чтобы дублирующие части информации можно было пропустить в процессе ее хранения.

До сегодняшнего дня основное корпоративное использование этих технологий заключалось в архивировании электронной почты. Сейчас рынок начинает расширяться, потому что компании вроде Sun Microsystems и NetApp начали поставлять инструменты, обеспечивающие дедупликацию основных систем хранения данных.

Аналитики говорят, что поскольку ИТ-менеджеры изучают возможности использования технологий дедупликации, им следует иметь в виду, что системы продолжат выходить за рамки узкоспециализированных решений. "Конечно, необходимо начать применять такие технологии уже сегодня, но внедрять нужно только те, которые могут адаптироваться и изменяться", - отмечает Филкс.

Главные производители специализированной продукции для процессов дедупликации - это Data Domain, Sepaton, EMCs Avamar unit, Diligent Technologies, FalconStor Software (чьи технологии перепродаются такими вендорами, как IBM, Sun и EMC) и Quantum.

Некоторые пользователи обнаружили, что дедупликация имеет огромные преимущества в определенной среде, например, в компаниях, где используются ленточные системы старого поколения.

Например, медицинский центр в Бостоне смог сократить 400 Тб информации, хранимой в своих ленточных библиотеках и на вторичных дисках систем хранения данных, до 3,5 Тб, одновременно устранив необходимость резервирования информации, с помощью дедупликационной системы виртуальной ленточной библиотеки производства Data Domain Corp. DD690, рассказывает ИТ-директор организации Брэд Блейк.

Медицинский центр планирует, что инвестиции в продукт окупятся и составят в целом от 300 до 400 тыс. долл. в течение последующих трех лет. Кроме того, по мнению Блейка, благодаря этому инструменту у организации нет необходимости в услугах Iron Mountain Inc. по архивированию данных, что в дальнейшем сократит издержки почти на 70 тыс. долл.

Блейк отметил, что, несмотря на то, что две виртуальные ленточные библиотеки Data Domain были довольно дороги (700 тыс. долл. за обе), это все же на 400 тыс. долл. дешевле замены устаревшей инфраструктуры резервирования информации в медицинском центре, куда вошла бы ленточная библиотека производства ADIC, дополненная комплектом вторичных дисков Centera от EMC.

ИТ-отдел, который возглавляет Блейк, управляет медицинской, клинической, электронной, кадровой и финансовой информацией, а также базой данных, которые хранятся на более чем 120 серверах. Данные Бостонского медицинского центра ежегодно увеличиваются на 40-50%.

©  @Astera