Совет по открытым данным: Рабочая группа по связанным данным, Открытость ПФР и Рослесхоза

image


В конце сентября состоялось очередное заседание Совета по открытым данным (официальный пресс-релиз). На повестке были открытые данные Пенсионного фонда России и Рослесхоза, а также создание рабочей группы по развитию связанных данных.

1. Пенсионный фонд России (ПФР), с деятельностью которого можно ознакомиться в его годовых отчетах, раскрывает данные с 2015 года и на сегодняшний день публикует 42 набора открытых данных в инициативном порядке. Перечень датасетов, форматы наборов и паспорта утверждаются в Распоряжении Правления ПФР от 19.11.2915 №554р «Об открытых данных Пенсионного фонда РФ», которое в открытом доступе мне найти не удалось. Практически все выборочно просмотренные наборы данных состоят из 1–10 строк и содержат крайне обобщенные (агрегированные) данные, то есть практическое использование их, на мой взгляд, малоосмысленно и не востребовано.

Совет по Открытым Данным рекомендовал ПФР публиковать дезагрегированные данные, указывать контакты ответственных лиц и взаимодействовать с референтными группами при публикации данных. Также ПФР было предложено проводить хакатоны для получения приложений и сервисов на основе их данных. По мнению Совета, стоимость проведения таких хакатонов равна нулю, а платить нужно только за результат. На самом деле это не совсем так, поскольку организация качественного мероприятия требует не только финансовых, но и трудовых затрат. Другим внебюджетным фондам (ФСС и ФФОМС) и негосударственным пенсионным фондам было рекомендовано сформировать и опубликовать свои данные. Уже сейчас на сайтах территориальных ФОМС (например, Санкт-Петербурга) можно найти детализированную и интересную статистику по работе поликлиник и больниц, оказанным услугам и количеству посещений гражданами. Правда, эти данные обычно немашиночитаемые.

2. Данные Рослесхоза уже обсуждали на одном из заседаний Совета по открытым данным в этом году. Тогда поднимался вопрос об отсутствии в открытом доступе сведений о квартальной сети, которые необходимы Рослесхозу для публикации данных. На сегодняшний день сведения о квартальной сети являются засекреченными, и, к сожалению, за полгода ничего не изменилось, так что этот вопрос поднимался снова. Доклады представителей Рослесхоза, Рослесинфорга, Федерального агентства лесного хозяйства и Всемирного фонда дикой природы можно свести к нескольким тезисам:

  1. Ведется работа над унификацией форм запросов и предоставления статистической информации и изучаются геопорталы регионов, среди которых лидерами являются Республика Коми и Кировская область.
  2. Часть данных Рослесхоз не публикует, мотивируя это Лесным кодексом, согласно которому некоторые сведения предоставляются только на платной основе.
  3. Отдельный доклад был посвящен геопорталу Рослесинфорга, ссылку на который докладчик не посчитал нужным предоставить ни в материалах, которые рассылались по почте перед заседанием Совета, ни в раздаточных, и продиктовал ее только после вопроса одного из присутствовавших. Воспринимать на слух доклад о портале, не имея возможности увидеть его или хотя бы скриншоты, было весьма затруднительно.


Несмотря на это, деятельность и участие Рослесхоза (и его Общественного совета, проработанность докладов и материалов которого вызывает уважение) в Совете по открытым данным, как и в прошлый раз, оставляет положительное впечатление и надежду на появление новых датасетов. Доклады структурированные, не зачитываются дословно, а докладчики озвучивают те проблемы, которые мешают им публиковать больше данных. Из озвученных Рослесхозом планов меня заинтересовало его намерение рассмотреть возможность публикации всех договоров аренды и карту свободных участков лесов.

3. Проектный офис Открытого Правительства представил методические рекомендации по организации и планированию деятельности в области открытых данных. Надеюсь, что они будут опубликованы в открытом доступе, т.к. подробно изучить и прокомментировать их у меня времени за полтора месяца не нашлось)).

4. Самым интересным пунктом повестки, на мой взгляд, был доклад и предложение о создании рабочей группы по развитию связанных открытых данных (Linked Open Data) при Совете по открытым данным. Несколько органов власти уже пытались публиковать свои данные в формате связанных: например, Министерство Культуры и портал открытых данных Тулы опубликовали данные, которые формально соответствовали синтаксису RDF, но фактически в них не было семантики. Наиболее грамотно связанные данные были опубликованы ФССП России, которые на основе британской онтологии организаций (Organization Ontology) подготовили массив данных с информацией о сотрудниках и их контактах. На мой взгляд, эти данные не самые интересные для преобразования в формат связанных, но к их структуре и семантике претензий нет.

Рабочая группа по развитию связанных открытых данных при Совете по открытым данным, создание которой было утверждено Советом (а к сегодняшнему дню уже подготовлен план работы и состав группы) будет заниматься следующими направлениями:

  1. Разработка стандартов по представлению связанных данных (вторичные открытые данные), которая должна проходить в рамках консорциума или рабочей группы.
  2. Распространение международного опыта (например, W3C) и успешных кейсов, аналитики. Методологическая поддержка, ориентированная на снижение технологических барьеров у потребителей открытых данных и публикаторов.
  3. Разработка общих подходов и URI для открытых государственных связанных данных на всех уровнях власти (одна из наиболее актуальных проблем, по отзывам представителей индустрии).


В целом, заседание Совета в этот раз было кратким и систематизированным, есть надежда, что данных будет больше и они будут качественнее и структурированнее. Удивляет только выбор ФОИВов, деятельность которых рассматривается на заседаниях: например, «лесные» ведомства в этом году обсуждаются второй раз, а «финансовых» еще не было.

© Habrahabr.ru