Google оцифрует 800 тыс книг индийского университета

Google оцифрует 800 тыс книг индийского университетаGoogle намеревается оцифровать архивы индийского университета. Порядка 800 тысяч книг Университета Майсура будут переданы сотрудникам поискового гиганта для дальнейшего распространения исторических ценностей в Интернет. Индийские манускрипты будут включены в каталог службы Google Book Search. В рамках Google Book Search компании удалось получить разрешение на оцифровку материалов из архивов крупнейших университетов и библиотек.Вначале, Университета Майсура оформит свои права на тексты, выдающиеся на оцифровку и лишь потом они будут представлены читателям через сервис Google.

Стоит заметить,  что материалы народностей, чей государственный язык не английский, весьма интересуют специалистов Google. Французский Университет Лозанны предложил поисковому гиганту обширную коллекцию своих материалов. Благодаря соглашению с Университетом Майсура, база данных Google пополнится материалами на санскрите и каннада. Как заметили эксперты, основной трудностью по оцифровке станет перевод рукописного текста в машинные символы. Поскольку машины по оптическому распознаванию могут оцифровать текст, который написано разборчиво, рукописи будет перевести затруднительно. Компания использует собственную технологию OCRopus для решения этой проблемы.

©  TechLabs