Московские школы. Как мы участвовали во втором хакатоне по открытым данным
В эти выходные, 10-11 октября, в Москве проходил второй хакатон по открытым данным. Мы заняли на нём первое место и я хотел бы рассказать, что мы делали и как всё проходило.
За несколько дней до хакатона я узнал про интересный сайт — Российские школы. Там собраны данные про результаты сдачи ЕГЭ по многих школам России. Всем, кто немного в теме про открытые данные известно, что результаты ЕГЭ — это жутко секретная информация. Где же ребята её достали, подумал я? Оказалось, что школы каждый год публикую на своих сайтах так называемые публичные отчёты, там есть масса полезной информации: результаты ЕГЭ и ГИА, списки призёров олимпиад, описание учительского состава. Так вот, ребята просто скачали несколько сотен таких докладов, прочитали их, выписали нужную информацию в табличку и сделали сайт. По-моему, очень круто. Вместо того, чтобы ныть и ругаться с министерствами, они просто сделали полезное дело.
На хакатоне мы решили сделать то же самое только для Москвы и немного по-другому оформить. Взяли топ-100 школ за 2015 год по версии Министерства образования. Скачали для каждой публичный доклад, для московских школ это сделать легко, все сайты однотипные и имеют специальный раздел для доклада. Примерно за 15 часов мы прочитали все отчёты и выписали в отдельную табличку количество учеников, результаты по ЕГЭ и по ГИА.
В некоторых отчётах школы рассказывали, в какие ВУЗы поступают их выпускники. Но такая информация встречалась очень редко, поэтому мы решили сделать ход конём: найти выпускников школ в Контакте и посмотреть какие ВУЗы они указывают у себя в профилях.
Были сомнения в качестве данных, полученных таким образом. Но если посмотреть, куда чаще всего поступают, например, из лицеев при МЭИ и при Бауманке, становится поспокойнее:
Адреса школ взяли с data.mos.ru и прогнали через яндексовый геокодер. Всё это аккуратно оформили и выложили на obr.msk.ru. Комментарии вида: «тупицы моя школа находится в марьино, а не на тверской», «вы чо у нас никто в мгу не поступает», «у нас от силы 500 человек учится, а вы пишете 3012» приветствуются.
Про то, как делался сайт я, к сожалению, ничего сказать не могу. Им занимался Лёха из Российских школ, он использовал ReactJS и какой-то диалект javascript, в котором я ни в зуб ногой.
За пару часов до конца хакатона произошло удивительное событие. К нам подошёл один из менторов и сообщил, что у него есть данные по всем школам Москвы, сказал, что через несколько дней они появятся в публичном доступе, но нам он их может передать прямо сейчас. Происходящее полностью противоречило моему опыту общения с государственными органами, но тем не менее табличку мы получили. Там не было результатов ЕГЭ в разбивке по предметам, но было много другой полезной информации. Пока мы использовали эти данные, только чтобы расширить покрытие топа Минобра с топ-100 до топ-300 школ.
В целом, организация этого хакатона была заметно лучше: хороший интернет, куча менторов, заставляли показывать продукт, а не презентации. Но интересных проектов было меньше, чем в прошлый раз. Вот такой парадокс.