Microsoft создал искусственный интеллект, отвечающий на вопросы о прочитанном17.01.2018 14:16

Это важная веха в развитии поисковых систем и интеллектуальных помощников, таких как Bing и Кортана. Новые достижения позволят сервисам взаимодействовать с людьми и предоставлять информацию естественными способами, больше похожими на общение людей друг с другом.

Исследовательская группа Microsoft Research Asia получила результаты, сравнимые с человеческими, используя набор данных SQuAD (Stanford Question Answering Dataset), разработанный специалистами из Стэнфордского университета. Этот набор данных для машинного чтения и понимания текстов содержит вопросы, основанные на статьях из Википедии.

Как видно из таблицы лидеров SQuAD, 3 января Microsoft предложила модель, получившую в тесте на поиск точного соответствия результат 82,650. Средний результат людей, отвечавших на тот же набор вопросов— 82,304. 5 января исследователи из китайской интернет-компании Alibaba получили результат 82,440, тоже сравнимый с человеческим.

Сейчас эти две компании занимают первые места в списке лидеров SQuAD, показывающем результаты исследовательских организаций.

Microsoft делает большие инвестиции в развитие средств машинного чтения и понимания текста, стремясь создавать больше технологий, с которыми люди могут взаимодействовать простыми, интуитивно понятными способами. Например, разработчики поисковой системы Microsoft Bing работают над тем, чтобы люди могли вводить запрос и получать в ответ не просто список ссылок, но и прямые ответы или список из разных источников информации, если вопрос сложный или спорный.

Технологии машинного чтения и понимания текстов позволят компьютерам быстро обрабатывать содержание книг и документов, а затем предоставлять людям необходимую информацию в простом и понятном виде.

Например, водители смогут быстро найти ответ в обширном справочнике по автомобилю, сэкономив время и усилия в сложных ситуациях. Врачи, юристы и другие специалисты будут быстрее справляться с задачами, требующими изучения многих документов для поиска редких прецедентов и прочих специфических данных. Новые технологии повысят эффективность их работы и позволят уделять больше времени лечению пациентов и урегулированию юридических вопросов.

Предыдущие версии моделей Microsoft, использованных для прохождения теста SQuAD, уже применяются в поисковой системе Bing. Сейчас компания работает над их применением для решения более сложных задач.

Например, Microsoft разрабатывает технологии, позволяющие компьютеру отвечать не только на исходный вопрос, но и на последующие. Предположим, вы спрашиваете компьютер: «В каком году родилась премьер-министр Германии?», а потом хотите, чтобы он понял и следующий вопрос: «В каком городе она родилась?»

Эта технология позволит давать естественные ответы, требующие обработки информации из нескольких предложений. Например, если спросить: «Является ли Джон Смит гражданином США?», ответ может быть взят из двух предложений: «Джон Смит родился на Гавайях. Гавайи относятся к США».

Мин Чжоу (Ming Zhou), заместитель директора Microsoft Research Asia, говорит, что результаты теста SQuAD представляют собой важную веху, но в целом люди по-прежнему гораздо лучше компьютеров справляются с пониманием нюансов и сложностей языка.

«В области обработки естественного языка до сих пор много сложных задач, которые мы должны решить, чтобы двигаться вперед, — говорит Чжоу.— Пока мы только в начале пути».