Совет по открытым данным: вести с полей


image
источник фото: сайт Открытого Правительства

23 декабря мне впервые посчастливилось побывать на заседании Совета по открытым данным. Участвовала я от лица АНО «Информационная культура», своим участием добавив общественный сектор к представителям госсектора и бизнеса.

Состав декабрьского заседания совета был, на первый взгляд, внушительным: собрались представители Минфина, Казначейства, Росстата, Минэкономразвития, Открытого Правительства, НИУ ВШЭ, Аналитического Центра «Форум», Аналитического центра при Правительстве и Яндекса — как видно из списка, некоммерческого сектора очень не хватает. Повестка состояла из шести объемных пунктов, но это не помешало заседанию начаться на полчаса позже, что, впрочем, не вызвало удивления присутствовавших и не сопровождалось какими-либо комментариями организаторов.

1. Исключение дублирования статистических показателей в отчетности Росстата

Первым пунктом повестки был доклад Росстата о том, как исключить дублирование показателей в различных отчётах и как публиковать первичную статистическую информацию в формате открытых данных. Доклад вызывает множество вопросов, начиная с способа подачи материала, который заключался в дословном прочитывании текста из раздаточных материалов. Из содержательного запомнились два пункта:

Первый тезис заключался в том, что «дублирование показателей создает неоправданную нагрузку на бизнес и бюджеты всех уровней», что подразумевает многократную подготовку и сдачу одних и тех же показателей. Удивил комментарий министра Открытого Правительства Михаила Абызова, который прямо сказал, что сотни тысяч чиновников на рабочих местах только и делают, что находят цифры по форме из excel-таблиц, которые внезапно понадобились их руководителям. Что касается Росстата, то, на мой взгляд, намного интереснее тот факт, что нагрузку на бюджеты создает и само ведомство, когда продает региональным и муниципальным госорганам собранные данные. То есть работа Росстата оплачена не только нашими налогами, но и результаты этой работы продаются внутри государства, и на это идут региональные и муниципальные средства. Но вариант снижения нагрузки на бюджеты за счет отмены продажи данных не был озвучен.

image
контракт на закупку показателей статистической отчетности Администрацией губернатора Пермского края у территориального органа ФСГС. Источник: проект Госзатраты

Второй тезис — это работа Росстата с большими данными. Из озвученного текста у меня не сложилось впечатление, что представители Росстата правильно понимают и эту область и терминологию, т.к. по их мнению большие данные — это что-то отдельно-стоящее от всех остальных данных и, естественно, требующее дополнительного финансирования. Например, Росстат предлагает «создание единого межведомственного координационного центра по использованию Больших данных в официальной статистике», «обеспечение Росстатом единого методологического контроля (надзора) за использованием Больших данных в официальной статистике», «разработку и принятие комплекса законодательных и НПА, обеспечивающих возможность и устанавливающих порядок использования Больших данных в официальной статистике». Подозреваю, что «Большие данные» у Росстата уже есть, правда, они об этом не догадываются.

Хотя по Росстату, судя по моему опыту, основная проблема сегодня заключается в том, что данные не предоставляются в формате открытых данных. Муниципальную статистику в виде датасетов скачать нельзя, массивы, выгружаемые на федеральный портал, сильно раздроблены (за счет чего увеличивается их количество, которое так важно для рейтингов), а статистические сборники, состоящие в основном из таблиц, публикуются в формате doc и сверстаны для печати, а не для работы с данными.

2. Обсуждение порталов Казначейства

После Росстата «докладывалось» Казначейство. Их доклад можно назвать образцовым выступлением госоргана — красочная презентация с необходимыми поясняющими фразами, грамотная речь, понятное и интересное содержание. Были представлены ресурсы bus.gov.ru и budget.gov.ru, а также приказы, на основании которых госорганы, государственные и муниципальные учреждения должны публиковать данные о себе. Интересно, что минут 20 на заседании шло обсуждение того, нужно ли менять один из приказов Минфина России и добавлять в перечень обязательных данных координаты фактического расположения учреждения или все же пользоваться API Яндекса/Google для генерации координат. Благодаря аргументации руководителя Департамента ИТ Минфина России Елены Черняковой, сотни тысяч муниципальных учреждений не будут задаваться вопросом, какие у них координаты и где их найти. Впрочем, это не было удивительным, т.к. интересные и адекватные выступления и ответы на вопросы Е. Черняковой — это то, чего я жду на каждом мероприятии.

image
портал bus.gov.ru для размещения данных о государственных учреждениях

Хотя также, как и с Росстатом, в процессе работы с рассматриваемыми порталами Казначейства, мы выявили куда существенные проблемы чем те, которые обсуждались на совете:

  • на портале bus.gov.ru неправильно преобразуется в структурированный формат финансовая отчетность: отображаемые на сайте данные не соответствуют тому, что указано в прикрепленных оригиналах;
  • на портале bus.gov.ru отсутствует документированное API, и блокировка IP-адреса осуществляется при просмотре данных всего 50 учреждений, то есть бесполезно выкладывать и обсуждать новые данные, если даже то, что есть, скачать/использовать практически невозможно;
  • на портале budget.gov.ru в конструкторах данных много багов, например, теряется выбор пунктов при переносе фильтра в раздел «Показатели» или показываются удвоенные суммы доходов/расходов, если отметить пункт «выбрать все» в фильтре «Уровень бюджета»;
  • важно уточнить, проводится ли каким-то образом верификация данных, вводимых представителями госучреждений на портале bus.gov.ru: о том, как представители госзаказчиков формируют данные по госконтрактам, мы знаем уже давно, а ошибки в финансовой отчетности выявили недавно, но «исправляет» их Казначейство уже несколько месяцев.

Интересно, что при обсуждении геолокации учреждений, Михаил Абызов поднял вопрос о том, можно ли заставить учреждения (школы) публиковать все данные по ЕГЭ, — теперь мы знаем, кто из государственных служащих поддерживает открытость образовательных данных и с кем стоит коммуницировать «Российским школам».

В этом пункте повестки Елена Чернякова из Минфина России раскрыла тайну многочисленных ошибок в данных ЕГРЮЛ, о работе над которым Татьяна Нестеренко рассказывала на Московском финансовом форуме в сентябре (на исправление данных в ЕГРЮЛ у Минфина России ушло полгода, 600 млн рублей и 200 000 человекочасов). Проблема в том, что подача данных в ЕГРЮЛ носит заявительный характер, поэтому, например, фактический адрес, указанный индивидуальным предпринимателем, проверить практически невозможно. Поэтому, когда Минфин России занялся обновлением своих информационных систем, 80% государственных и муниципальных учреждений пошли править свои данные в ЕГРЮЛ.

3. Предложения Аналитического центра при Правительстве по публикации данных госкорпораций и публичных акционерных обществ

Третьим пунктом Аналитический центр при Правительстве РФ представил доклад «О совершенствовании работы государственных корпораций и публичных акционерных обществ с открытыми данными». Основная идея заключалась в том, чтобы обязать указанные организации публиковать в машиночитаемых форматах ту информацию, которую они уже обязаны раскрывать (общие сведения об организации, вакансии, сведения об охране окружающей среды и т.д.). На это один из участников заседания справедливо заметил, что тогда мы получим миллион датасетов в разных форматах на разных сайтах, и намного логичнее опубликовать открытую часть ЕГРЮЛ и другие данные, которые собирает у тех же учреждений Росстат или Росприродназдор. Замечание про ЕГРЮЛ было одним из самых ценных комментариев на совете, поскольку мы давно об этом говорим ФНС, но, к сожалению, в проекте протокола этого комментария нет.

4. Саммит по открытым данным и конкурс Открытого Правительства

Четвертым пунктом было обсуждение саммита, перенесенного на февраль, и конкурса по открытым данным. Вряд ли что-то можно рассказывать об этом пункте до подведения итогов конкурса, но к статистике по прошлому конкурсу это не относится. Было озвучено, что большое количество проектов, поданных на прошлый конкурс (или 50 проектов, или 50%), продолжают развиваться. Хотелось бы посмотреть на этот список, потому что обычно через год после проведения конкурса или хакатона практически все проекты становятся недоступными или заброшенными.

5. О работе федеральных органов исполнительной власти по открытым данным в 2016 году

Пятым пунктом было перенесенное на февраль подведение итогов работы органов государственной власти по раскрытию информации в форме открытых данных. Примечательно, что в материалах к заседанию в качестве лидеров среди ФОИВ указаны далеко не финансовые госорганы (Казначейство, Минфин России, ФНС), чья работа в области открытости не вызывает сомнений, а, на первый взгляд, выбранные случайным образом. Возможно, этот список составлен на основе рейтинга, подготовленного недавно Открытым Правительством и ВЦИОМ.

image
«безусловно открытые ведомства» по результатам рейтинга Открытого Правительства и ВЦИОМ

image
«аутсайдеры» рейтинга Проектного центра «Инфометр»

В отличие от прозрачного, понятного и основанного на законодательстве рейтинга Инфометра, рейтинг ВЦИОМа и ОП вызывает много вопросов. Во-первых, за основу в нем принимается количество датасетов, при этом Росстат, целью деятельности которого является сбор данных, оценивается наравне с остальными ведомствами. Во-вторых, значительной составляющей итоговой оценки является «востребованность» наборов, которая определяется как количество скачиваний с федерального портала data.gov.ru. Специально перед советом просмотрела ТОП-7 федеральных ведомств по количеству датасетов на этом портале. Общее количество скачиваний за все время существования портала у «лидирующих» ведомств составляет примерно 100–150 раз (это суммарное количество скачиваний всех датасетов одного ведомства), то есть вместо того, чтобы судить о невостребованности наборов, нужно судить о невостребованности данного портала. В-третьих, этот рейтинг оценивает только данные, размещенные на федеральном портале, не принимая во внимание активность ведомств на своих сайтах, за счет чего госорганы вынуждены дублировать свои данные и на федеральном портале (причем иногда вручную).

image
статистика количества скачиваний с портала data.gov.ru датасетов Ростуризма (154), Росавтодора (70) и Минпромторга России (61). По количеству датасетов среди ФОИВ они на 3, 2 и 4 месте.

Подводя итоги…

Шестой пункт о схеме взаимодействия Минкомсвязи России с Советом по открытым данным зачитан не был и не обсуждался (а у меня терпение во время чтения материалов закончилось раньше).

В целом, совет вызывает двойственное впечатление: что-то было адекватно и интересно: например, доклад Казначейства и некоторые комментарии; также порадовало участие в мероприятии компетентных людей. Что-то, с другой стороны, было слишком формальное и напоминающее «обязаловку», в чем-то проглядывало непонимание ни работы с данными, ни специфики открытых или больших данных. Непосредственно обсуждению докладов уделяется очень мало времени — какие-то незапланированные в повестке комментарии вставить сложно, и, конечно, обсуждение открытых данных в закрытом режиме выглядит довольно странным. Посмотрим, что будет дальше.

Комментарии (0)

© Habrahabr.ru