Неочевидное использование открытых данных

Я думал стоит ли писать этот пост или нет, потом решил что всё таки стоит — Еще до того как я занялся плотно открытыми данными, я довольно много лет занимался и занимаюсь сейчас различными задачами по классификации, анализу текстов, полуструктурированных данных, очистке и обогащению данных. Например, довольно давно еще я сделал алгоритм автоматического разбора ФИО в любом написании, определения пола и, возможно, этноса. Это не самая сложная задача, я привожу её не как нечто выдающееся, а как нечто рутинное и типовое. Однако решение этой, довольно типовой задачи, Вопрос в том как решать это нечто типовое. И вот тут то и пригодились открытые данные. Однако начну с начала. Читать дальше →

© Habrahabr.ru