Компания Oracle представила NoSQL-решение на базе Berkeley DB, Apache Hadoop и R

Компания Oracle анонсировала новую платформу для организации хранения больших объемов данных - Oracle Big Data Appliance, позволяющую организовать надежное хранение и анализ петабайтов данных. Решение позволяет обеспечить горизонтальную масштабируемость (при необходимости увеличения хранилища в кластер добавляются новые узлы), высокую надежность хранения (данные дублируются на нескольких узлах) и отсутствие единой точки отказа (в синхронном состоянии поддерживаются несколько узлов репликации).

Платформа функционирует на базе Oracle Linux и построена на базе следующих открытых компонентов:

  • Для организации распределенного отказоустойчивого хранилища задействована платформа Apache Hadoop, базирующаяся на парадигме map/reduce;
  • Для управления данными поверх кластера Hadoop запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB (Oracle Berkeley DB Java Edition), оперирующая данными в форате ключ/значение и позволяющая гарантировать целостность и атомарность выполняемых транзакций;
  • Для анализа и статистической обработки данных предлагается использовать язык программирования R (поставляется открытый пакет Oracle R Enterprise, отличающийся адаптацией для работы с данными в кластере Hadoop).

©  OpenNet