Яндекс, роботы и Сибирь — как мы сделали систему поиска по загруженному изображению

Сегодня Яндекс запустил поиск картинки по загруженному изображению. В этом посте мы хотим рассказать о технологии, которая стоит за этим сервисом, и о том, как её делали. Технология внутри Яндекса получила название «Сибирь». От CBIR — Content-Based Image Retrieval. Конечно, сама по себе задача не нова, и ей посвящено множество исследований. Но сделать прототип, работающий на академической коллекции, и построить промышленную систему, которая работает с миллиардами изображений и большим потоком запросов — очень разные истории.422210772e549c20fc906374961ce45b.jpgДля чего всё это нужно? Есть три сценария, при которых нужен поиск по загруженной картинке и которые нам и нужно было научиться обрабатывать.Читать дальше →

© Habrahabr.ru