Совет по открытым данным: Рабочая группа по связанным данным, Открытость ПФР и Рослесхоза
В конце сентября состоялось очередное заседание Совета по открытым данным (официальный пресс-релиз). На повестке были открытые данные Пенсионного фонда России и Рослесхоза, а также создание рабочей группы по развитию связанных данных.
1. Пенсионный фонд России (ПФР), с деятельностью которого можно ознакомиться в его годовых отчетах, раскрывает данные с 2015 года и на сегодняшний день публикует 42 набора открытых данных в инициативном порядке. Перечень датасетов, форматы наборов и паспорта утверждаются в Распоряжении Правления ПФР от 19.11.2915 №554р «Об открытых данных Пенсионного фонда РФ», которое в открытом доступе мне найти не удалось. Практически все выборочно просмотренные наборы данных состоят из 1–10 строк и содержат крайне обобщенные (агрегированные) данные, то есть практическое использование их, на мой взгляд, малоосмысленно и не востребовано.
Совет по Открытым Данным рекомендовал ПФР публиковать дезагрегированные данные, указывать контакты ответственных лиц и взаимодействовать с референтными группами при публикации данных. Также ПФР было предложено проводить хакатоны для получения приложений и сервисов на основе их данных. По мнению Совета, стоимость проведения таких хакатонов равна нулю, а платить нужно только за результат. На самом деле это не совсем так, поскольку организация качественного мероприятия требует не только финансовых, но и трудовых затрат. Другим внебюджетным фондам (ФСС и ФФОМС) и негосударственным пенсионным фондам было рекомендовано сформировать и опубликовать свои данные. Уже сейчас на сайтах территориальных ФОМС (например, Санкт-Петербурга) можно найти детализированную и интересную статистику по работе поликлиник и больниц, оказанным услугам и количеству посещений гражданами. Правда, эти данные обычно немашиночитаемые.
2. Данные Рослесхоза уже обсуждали на одном из заседаний Совета по открытым данным в этом году. Тогда поднимался вопрос об отсутствии в открытом доступе сведений о квартальной сети, которые необходимы Рослесхозу для публикации данных. На сегодняшний день сведения о квартальной сети являются засекреченными, и, к сожалению, за полгода ничего не изменилось, так что этот вопрос поднимался снова. Доклады представителей Рослесхоза, Рослесинфорга, Федерального агентства лесного хозяйства и Всемирного фонда дикой природы можно свести к нескольким тезисам:
- Ведется работа над унификацией форм запросов и предоставления статистической информации и изучаются геопорталы регионов, среди которых лидерами являются Республика Коми и Кировская область.
- Часть данных Рослесхоз не публикует, мотивируя это Лесным кодексом, согласно которому некоторые сведения предоставляются только на платной основе.
- Отдельный доклад был посвящен геопорталу Рослесинфорга, ссылку на который докладчик не посчитал нужным предоставить ни в материалах, которые рассылались по почте перед заседанием Совета, ни в раздаточных, и продиктовал ее только после вопроса одного из присутствовавших. Воспринимать на слух доклад о портале, не имея возможности увидеть его или хотя бы скриншоты, было весьма затруднительно.
Несмотря на это, деятельность и участие Рослесхоза (и его Общественного совета, проработанность докладов и материалов которого вызывает уважение) в Совете по открытым данным, как и в прошлый раз, оставляет положительное впечатление и надежду на появление новых датасетов. Доклады структурированные, не зачитываются дословно, а докладчики озвучивают те проблемы, которые мешают им публиковать больше данных. Из озвученных Рослесхозом планов меня заинтересовало его намерение рассмотреть возможность публикации всех договоров аренды и карту свободных участков лесов.
3. Проектный офис Открытого Правительства представил методические рекомендации по организации и планированию деятельности в области открытых данных. Надеюсь, что они будут опубликованы в открытом доступе, т.к. подробно изучить и прокомментировать их у меня времени за полтора месяца не нашлось)).
4. Самым интересным пунктом повестки, на мой взгляд, был доклад и предложение о создании рабочей группы по развитию связанных открытых данных (Linked Open Data) при Совете по открытым данным. Несколько органов власти уже пытались публиковать свои данные в формате связанных: например, Министерство Культуры и портал открытых данных Тулы опубликовали данные, которые формально соответствовали синтаксису RDF, но фактически в них не было семантики. Наиболее грамотно связанные данные были опубликованы ФССП России, которые на основе британской онтологии организаций (Organization Ontology) подготовили массив данных с информацией о сотрудниках и их контактах. На мой взгляд, эти данные не самые интересные для преобразования в формат связанных, но к их структуре и семантике претензий нет.
Рабочая группа по развитию связанных открытых данных при Совете по открытым данным, создание которой было утверждено Советом (а к сегодняшнему дню уже подготовлен план работы и состав группы) будет заниматься следующими направлениями:
- Разработка стандартов по представлению связанных данных (вторичные открытые данные), которая должна проходить в рамках консорциума или рабочей группы.
- Распространение международного опыта (например, W3C) и успешных кейсов, аналитики. Методологическая поддержка, ориентированная на снижение технологических барьеров у потребителей открытых данных и публикаторов.
- Разработка общих подходов и URI для открытых государственных связанных данных на всех уровнях власти (одна из наиболее актуальных проблем, по отзывам представителей индустрии).
В целом, заседание Совета в этот раз было кратким и систематизированным, есть надежда, что данных будет больше и они будут качественнее и структурированнее. Удивляет только выбор ФОИВов, деятельность которых рассматривается на заседаниях: например, «лесные» ведомства в этом году обсуждаются второй раз, а «финансовых» еще не было.