BudgetApps — Первый Всероссийский конкурс по открытым финансовым данным

Друзья, под закат уходящего 2014 года и начала 2015 есть отличная новость для всех кто любит работать с открытыми данными, участвовать в конкурсах для разработчиков.А также, я уверен, что есть и те кто любит историю и исторические данные.

С 23 декабря Минфин России с нашей помощью Информационной культуры открывает конкурс приложений BudgetApps http://budgetapps.ru/contest на открытых данных которые Минфин России публиковал последние несколько лет.

e833576871bf4e9e94ebb90d8f7ec7b0.png

Данные самые разные. Это данные о бюджетах, данные об аудиторских организациях, государственном долге, государственных резервах и многое другое.

Ну и, так оказалось, что меня зовут Иван Бегтин и я член жюри этого конкурса.

Все они есть по ссылке на сайте Минфина — http://minfin.ru/ru/opendata/И много бюджетных данных есть на Едином портале бюджетной системы — http://budget.gov.ru/data/opendata там есть структура бюджета в CSV формате, сами данные, справочники и многое и многое другое. А также данные по всем официальным учреждениям вот тут http://bus.gov.ru/public/opendata.html. На этот ресурс обратите особое внимание. Там опубликованы индикаторы, бюджеты, уставы и многое другое по каждой государственной организации и муниципальном учреждении в России. Если Вы задумаете любой региональный проект, то эти данные будут просто бесценны.

Это не значит, что нельзя использовать какие-либо другие данные, безусловно можно и нужно, однако поскольку это конкурс Минфина России, то конечно ожидается что другие данные будут использоваться вместе с этими.

Я лично считаю, что не стоит ограничиваться только теми данными которые уже переведены в машиночитаемый вид. Есть также данные которые можно превратить в открытые данные самостоятельно.Многие умеют писать парсеры, но для тех кто этого не делал раньше, хорошее подпорье может быть ScraperWiki (https://scraperwiki.com/) чтобы собрать информацию со страниц, а также разные библиотеки для разбора Excel файлов, извлечение таблиц из PDF документов — с помощью pdftables.com/ или сервисов Abbyy или их Abbyy Finereader.

На сайте и других ресурсах Минфина кроме данных есть множество другого интересного что можно превратить в данные. Начиная просто от новостей которые стали особенно актуальны в последние дни, продолжая всем остальным.

Исторические бюджетыЕсть огромное направление в открытии данных которое мы столь долго упускали — это направление исторических данных. Тех которые хранятся в архивах в виде больших томов справочников с мириадами таблиц и которые просто необходимы в тот момент когда мы начинаем обращаться к истории, ссылаясь на факты, создавая спецпроекты посвящённые какому-либо событию.В самые ближайшие дни будут опубликованы первые сканированные бюджеты Российской Империи и Советского Союза. Чуть позже, но тоже очень скоро, появятся все сканированные бюджеты Российской Империи, СССР и РСФСР которые только существуют.

Кроме сканов будут опубликованы и сами данные, преобразованные в таблицы Excel и CSV, реконструированные из справочников в первичном виде и приведенные нами в порядок для последующей визуализации или проекта.

Скажу честно, не будь я членом жюри этого конкурса, я бы лично сделал спецпроект на этих данных. А может быть его еще и сделаю когда конкурс закончится, а может быть кто-то сделает это до меня.Уже готовы данные бюджетных росписей по нескольким годам, как первичные данные, полученные из текстов книг, так и обработанные и сопоставленные по разным годам.

Поэтому исторические данные вот-вот уже скоро будут, а пока можно начать использовать имеющиеся и заглянуть на общественный проект «Исторические материалы» (istmat.info) где собраны многие бюджетные справочники СССР и Российской Империи.

Где найти больше данных? Какие дополнительные источники данных у нас есть.Хаб открытых данных — hubofdata.ru негосударственный реестр открытых данных поддерживаемый НП «Информационная культура». Много всего, более 5000 массивов данных, но всё неофициальное. Данные Федерального казначейства — http://roskazna.ru/opendata/ Веб-сервисы ЦБ России — http://cbr.ru/scripts/Root.asp множество интересных данных по российским финансам. Портал открытых данных России — http://data.gov.ru/ его польза в том что он агргегирует множество российских и не только данных. Данные Всемирного Банка — где также есть информация о России http://data.worldbank.org/ Данные ООН — http://data.un.org/ И многое другое.Я знаю что многие используют данные из Википедии и DBPedia, кто-то собирает их сам, а кто придумывает что-то своё.

Что можно сделать? Во первых и в главных — это проекты по понятности государственных финансов. Наглядно представить как устроен бюджет или государственный долг или какая-то отдельная область финансов.Во вторых, конечно же, бесконечное количество проектов может быть сделано на данных из bus.gov.ru.

Хотите сделать реестр больниц и сравнить их? Они все там.Хотите сравнить между собой все государственные университеты? И они все там.Хотите сделать карту доступности госуслуг и такие данные там есть.Хотите визуализировать бюджеты МГУ, СПБГУ, МИФИ, МИРЭА или любого Вашего любимого университета? И это возможно.

А по историческим данным — просто даже визуализировать их и сравнить с тем что было и тем что есть сейчас — это уже большая и интересная задача.

Зачем это нужно? Помимо возможности получить вполне материальный приз, а призовой фонд составляет 400 тысяч рублей, конечно же этим всё не ограничивается. Если проект окажется хорошим и интересным то, конечно, он будет упомянут на сайте Минфина и это само по себе дополнительная реклама любому хорошему проекту.Как принять участие? Конкурс начался с 23-го декабря и его сайт находится по адресу www.budgetapps.ru. Там есть всё описание, несколько номинаций. Описание того как будет работать жюри и многое другое. Посмотрите, подумайте, и конечно же задавайте вопросы мне. Я буду отвечать тут и или напрямую пишите мне на почту — ibegtin@infoculture.ru

© Habrahabr.ru