Экстрактор контента из вэб-документов

afb5d8926a13a58e4a6c4d38925c33a7.gif Здравствуй, Хабр! Это мой первый пост, в котором я хочу поделиться своей наработкой в решении такой задачки, как выделение контента на странице. Собственно, задачка давно висела в голове в фоновом режиме. Но так сложилось, что именно сейчас мне самому понадобился инструмент, кроме того наткнулся на статейку на хабре: habrahabr.ru/company/mailru/blog/200394 и решил — пора. Ладно, поехали.Читать дальше →

© Habrahabr.ru