EMC делает ставку на Hadoop
На конференции EMC World 9 мая компания EMC представила ряд продуктов, ориентированных на свободную систему для распределенных приложений с кластерной архитектурой Hadoop. Среди них — специальное аппаратное решение для создания больших систем хранения данных для аналитических систем и два специальных дистрибутива Hadoop. Анонсированные продукты позволяют назвать EMC наиболее крупной компанией, предлагающей решения на базе Hadoop на сегодняшнем рынке. Кроме того, новые продукты могут позволить EMC выйти в один ряд с Oracle и Teradata на рынке аналитических систем.
Флагманский дистрибутив от EMC назван Greenplum HD Enterprise Edition. EMC описывает его как «100% совместимую по интерфейсам реализацию Apache Hadoop», которая также включает в себя функции корпоративного уровня, такие как снэпшоты с системой репликаций, встроенную сетевую файловую систему, а также штатные средства управления системой хранения данных и кластером. Заявлено, что по производительности дистрибутив от EMC превзойдет базовый дистрибутив Hadoop от 2 до 5 раз.
Следует отметить, что многие из этих функций доступны в альтернативной системе HDFS, предлагаемой стартапом MapR. CEO компании MapR также выступал на утренней секции EMC World, и, по мнению обозревателя GigaOM, весьма вероятно, что в основе решения от EMC лежит именно система от MapR, хотя об этом и не было объявлено напрямую.
Greenplum HD Enterprise Edition содержит проприетарные компоненты. Существует и полностью свободная версия — Community Edition (CE), которая содержит значительное количество улучшений относительно текущей версии Apache Hadoop. Community Edition основана на публично доступной оптимизированной версии Hadoop от Facebook.
Выпуск новых продуктов сделает EMC мощным конкурентом для таких компаний, как IBM, Oracle и Teradata, которые предлагают аппаратные системы для организации масштабных вычислений и систем, а также для вендоров баз данных для аналитических нужд, включая HP и ParAccel. Кроме того, анонсированные EMC продукты являются непосредственным вторжением в нишу компании Cloudera. Именно Cloudera до сих пор являлась ведущим поставщиком коммерческих решений на базе Hadoop.
© CNews