Доступна система классификации открытого контента CKAN 1.0

Представлен релиз проекта CKAN 1.0 (Comprehensive Knowledge Archive Network), нацеленного на классификацию наборов данных и контента. По своей сути CKAN напоминает смесь репозитория пакетов, версионной БД и каталога, при этом основное отличие от стандартных репозиториев в том, что CKAN вместо программ оперирует наборами знаний или данных. Из реализованных на базе технологии CKAN работают такие реестры, как ckan.net, data.gov.uk, datadotgc.ca и т.д.

Разработчики позиционируют проект как "Debian данных", собирая в рамках ресурса ckan.net репозиторий общедоступных наборов данных. Каждый набор данных упакован в пакет, в который также включена определенная мета-информация. Изменения во всех пакетах отслеживаются версионным методом, примерно так как осуществляется трекинг изменений страниц в wiki. Пакетам можно назначать теги, объединять в группы и рассчитывать рейтинг. В планах организация учета зависимостей между пакетами.

Код проекта написан на языке Python, управление производится через web-интерфейс или утилиту datapkg. Для разработчиков дополнений доступен специальный API, основанный на использовании формата JSON. Клиентские библиотеки для CKAN разработаны для языков Python, PHP и Perl. Имеется специальный бэкенд для построения online-каталогов. Все данные в пакетах проиндексированы и доступны в системе полнотекстового поиска.

©  OpenNet