Яндекс.Диск научился распознавать текст на изображениях

210541.gifОдной из самых сложных задач для поисковых систем является распознавание изображений. Компания Яндекс довольно давно занимается этим вопросом — еще в 2008 году популярный поисковик научился искать портреты среди картинок. Последнее время компания занималась реализацией технологии компьютерного зрения «Сибирь», с помощью которой можно было по загруженному изображению найти в Яндексе похожие картинки. А сегодня российская компания представила дополнительную функцию распознавания для хранилища Яндекс.Диск. Теперь пользователи сервиса смогут искать изображения, на которых содержится интересующий их текст.

Яндекс.Диск научился распознавать текст на изображениях

Таким образом, результаты поиска теперь содержат изображения, документы и папки, релевантные запросу. Работа сервиса основана на принципе искусственной нейронной сети. Сначала классификатор отбирает изображения, на которых присутствует текст, а затем приступает к углубленному анализу результатов. На этом этапе применяется ещё одна нейронная сеть — теперь машина распознает линии, содержащие текст. Линии в дальнейшем разбиваются на отдельные символы, после чего алгоритм подбирает наиболее подходящие буквы или цифры. Если из отобранных символов получается известное слово, то машина принимает его за результат.

Яндекс.Диск научился распознавать текст на изображениях

Яндекс.Диск распознает отсканированные листы на русском языке с точностью 80%, Для фотографий с надписями показатель равен 63,2%, а скриншоты сервис распознает с практически 100-% точностью. На данный момент, Яндекс.Диск умеет распознавать текст на форматах JPEG, GIF и PNG. Список языков распознавания включает английский, украинский, турецкий и русский.

iconДиск Yandex

Цена

Рейтинг

бесплатно

3,9

бесплатно

4

бесплатно

4,4

Источник:  4pda.ru

©  4PDA