Объясняем на карточках

На многие вопросы Яндекс умеет давать так называемые объектные ответы. Попробуйте спросить, например, что такое антаблемент или когда жил Ричард Львиное Сердце, и вы увидите справа от результатов поиска карточку с нужной информацией. Часто она содержит не только текст, но и другие данные об объекте вашего интереса. Если вы спрашивали про художника, вам покажут его картины, а если про музыканта — предложат послушать треки.

origОбъектный ответ

Необходимость получить быструю справку возникает на каждом шагу. Кто-то, читая новость об очередном открытии астрономов, захочет уточнить, что такое красное смещение. А кто-то, наткнувшись на интересную статью о новгородских берестяных грамотах, решит узнать, что такое Неревский конец. Но каждый раз отрываться от чтения и искать ответ в поисковике не очень удобно. Для таких случаев мы выпустили браузерное расширение Яндекс.Карточка.

Яндекс.Карточка позволяет справиться о том или ином объекте — человеке, предмете, событии или явлении, — не покидая веб-страницу, на которой вы находитесь. Она подчеркнёт в тексте слова и словосочетания, значение которых, возможно, потребуется уточнить, и покажет на всплывающих карточках подсказки. Кроме того, расширение предложит поискать заинтересовавшее вас слово в интернете или на сайте, где оно вам встретилось.

origПодсказки Яндекс.Карточки на сайте N+1

Как работает Яндекс.Карточка

Подсказки на карточках — это данные из базы объектных ответов Яндекса. Она содержит десятки миллионов записей и постоянно пополняется (подробнее о том, как она устроена, можно почитать здесь). Но какой полной ни была бы база, одних только определений недостаточно — нужно ещё решить, какие именно понятия в тексте нуждаются в подсказках, и подобрать для них такие описания, которые им больше всего подходят.

Одна из сложностей — в том, что в русском языке много омонимов, то есть слов, одинаковых по написанию, но разных по значению. Скажем, [кратко] может быть наречием, которому подсказка ни к чему, или фамилией скульптора — про него имеет смысл рассказать подробней. В таких случаях Карточка выдвигает несколько гипотез. Например, встретив слово [ЦСКА], она предположит, что это футбольный клуб, хоккейный клуб, баскетбольный клуб и так далее.

Выбрать наиболее подходящую гипотезу помогает метод машинного обучения Матрикснет. При этом учитывается несколько сотен факторов — в том числе контекст, характеристики объекта и его связи с другими объектами из текста. Например, если в тексте финансовой тематики встречается слово [открытие], оно может быть названием банка, а если рядом с [о нём] упоминается режиссёр Вячеслав Криштофович, это, вероятно, название фильма.

Подчёркивать в текстах все слова, которые есть в базе объектных ответов Яндекса, бессмысленно — читателю это будет только мешать. Чтобы подобрать подсказки, уместные в конкретном случае, Карточка использует так называемую «формулу важности».

Сначала Карточка оценивает, как часто то или иное понятие встречается в текстах в целом. Общеупотребительные понятия — например, «простуда» или «витамины», — отсекаются. Затем она проверяет, связаны ли оставшиеся слова с основной темой текста. Если в тексте про футбол единожды встретится фамилия политика, Карточка, скорее всего, не станет давать подсказку —, но зато уточнит подробности про футболистов и тренеров.

origПодсказка с картой на сайте Студии Артемия Лебедева

***

Яндекс.Карточка работает в браузерах на основе Chromium — это Яндекс.Браузер, Google Chrome, Opera и другие. Первая версия расширения вышла в декабре 2015 года. Недавно мы обновили Яндекс.Карточку — теперь она лучше учитывает контекст, а также распознаёт не только объекты, но и адреса. Нажав на адрес, вы увидите фрагмент карты с меткой. У расширения есть своя JS-библиотека: с её помощью разработчики могут добавить технологию на свой сайт. В этом случае карточки с подсказками смогут видеть даже те пользователи, которые не установили расширение.

©  Яндекс