В число первичных проектов Apache принято шесть новых продуктов

Организация Apache Software Foundation объявила об успешном завершении проверки в "инкубаторе" и принятии 6 новых продуктов в число первичных проектов, развиваемых под эгидой Apache. Перевод проектов, находящихся в инкубаторе или ранее разрабатываемых в качестве подпроектов, в разряд первичных означает, что продукты и развивающее их сообщество подтвердили способность следования принципам разработки Apache и теперь готовы для самостоятельного существования, не требующего дополнительного надзора.

Все проекты Apache управляются самостоятельно выбранными командами активных участников проекта. После перевода проекта в разряд первичных, избирается специальный комитет по управлению проектом (Project Mangement Committee), который образуется для контроля за ежедневными операциями, включая взаимодействие в сообществе и выпуск релизов.

Представлены следующие новые первичные проекты Apache:

  • Вышедшие из Инкубатора:
    • Apache Traffic Server - разработанный в недрах компании Yahoo, высокопроизводительный http-сервер для распределенных систем (cloud computing). Traffic Server представляет собой систему динамической обработки HTTP-запросов, которая использовалась в Yahoo последние 8 лет для доставки web контента конечным пользователям. При тестировании сервер позволил достичь отметки в 75 тыс. запросов в секунду, при суммарном дневном объеме трафика более 400 Тб. Одной из сфер применения программы является кеширование статичных объектов, таких как файлы, новостные статьи или картинки. Также сервер включает в себя набор сервисов для продуктивной работы в качестве распределенной «cloud»-системы: средства конфигурирования, управления сессиями, балансировки, авторизации и маршрутизации запросов.
  • Зародившиеся в составе других проектов, но преобразованные в самостоятельные продукты:
    • Apache Mahout - высокомасштабируемая реализация алгоритмов машинного обучения, работающая поверх Apache Hadoop, платформы для организации распределенных вычислений с использованием парадигмы map/reduce. Поддерживаются функции совместной фильтрации, кластеризации, классификации, интеллектуального анализа данных данных. Apache Mahout зародился в 2008 году как субпроект Lucene;
    • Apache Tika - легковесный и встраиваемый тулкит для определения типа контента и его анализа. Поддерживается полный набор MIME-типов и расширенные функции определения языка, на котором написан текст. Apache Tika являлся субпроектом Lucene и использовался в таких продуктах, как Solr, Nutch и Mahout, а также в проектах NASA, Day Software и Internet Archive.
    • Apache Nutch - модульный поисковый движок, основанный на технологиях Lucene, адаптированных для специфики поиска в web. Архитектура Nutch позволяет разработчикам легко создавать плагины для обработки нового медиа-контента, получения данных через нестандартные каналы, для формирования типовых запросов или организации поискового кластера. На базе Nutch построена демонстрационная поисковая система, в индексе которой находится более 100 миллионов страниц.
    • Apache Avro - быстрая система сериализации данных, включающая поддержку сложных и динамических структур, компактный бинарный формат хранения данных, поддержку RPC и возможность легкой интеграции с популярными динамическими языками программирования. Avro изначально развивался как субпроект Apache Hadoop.
    • Apache HBase - распределенная БД, построенная на основе идей, схожих с Google Bigtable. HBase расширяет Hadoop-стек возможностями произвольного доступа к данным в хранилище, offline-обработки информации, данных random read/write access to the Hadoop stack, обслуживания больших наборов данных в режиме реального времени. Цель проекта - обеспечение работы на обычном оборудовании базы данных, размером в миллиарды строк и миллионов столбцов. HBase успешно внедрена в таких компаниях, как Adobe, Flurry, Meetup, Mozilla, StumbleUpon, Trend Micro и Twitter.

Из ранее образованных в этом году первичных проектов также отмечены: распределенная база данных Cassandra, система управления версиями Subversion, платформа для создания интерактивных интернет-приложений Pivot, система анализа неструктурированных данных UIMA, Java EE-фреймворк для создания web-приложений Click, контейнер для размещения OpenSocial-приложений Shindig.

©  OpenNet