Яндекс.Диск научился распознавать текст на изображениях
Одной из самых сложных задач для поисковых систем является распознавание изображений. Компания Яндекс довольно давно занимается этим вопросом — еще в 2008 году популярный поисковик научился искать портреты среди картинок. Последнее время компания занималась реализацией технологии компьютерного зрения «Сибирь», с помощью которой можно было по загруженному изображению найти в Яндексе похожие картинки. А сегодня российская компания представила дополнительную функцию распознавания для хранилища Яндекс.Диск. Теперь пользователи сервиса смогут искать изображения, на которых содержится интересующий их текст.
Таким образом, результаты поиска теперь содержат изображения, документы и папки, релевантные запросу. Работа сервиса основана на принципе искусственной нейронной сети. Сначала классификатор отбирает изображения, на которых присутствует текст, а затем приступает к углубленному анализу результатов. На этом этапе применяется ещё одна нейронная сеть — теперь машина распознает линии, содержащие текст. Линии в дальнейшем разбиваются на отдельные символы, после чего алгоритм подбирает наиболее подходящие буквы или цифры. Если из отобранных символов получается известное слово, то машина принимает его за результат.
Яндекс.Диск распознает отсканированные листы на русском языке с точностью 80%, Для фотографий с надписями показатель равен 63,2%, а скриншоты сервис распознает с практически 100-% точностью. На данный момент, Яндекс.Диск умеет распознавать текст на форматах JPEG, GIF и PNG. Список языков распознавания включает английский, украинский, турецкий и русский.
Диск Yandex
Цена
Рейтинг
бесплатно
3,9
бесплатно
4
бесплатно
4,4
Источник: 4pda.ru
© 4PDA