ИИ решили привлечь к комментированию спортивных событий

76ec6271ef79b8c33205d5eec571310c.jpg

Narrativa — это стартап из Испании, цель которого — разработка платформы, способной кратко описывать спортивные события. Это могут быть, например, мультиязычные новости об успехах или неудачах разных команд из ряда стран. Дело в том, что у небольших спортивных команд (тот же футбол) есть довольно много болельщиков, которым неоткуда черпать информацию о своих фаворитах.

Давид Йоренте [David Llorente], один из основателей стартапа, говорит, что решил создать подобный проект после того, как не смог найти в сети информацию на испанском языке о любимой зарубежной команде. Эта команда не является чемпионом мира или хотя бы Европы, но Йоренте она очень по душе.
«Есть люди, которым интересно узнавать о таких командах в разных видах спорта», — рассказывает он. «Идея — фокусирование на региональном спорте. Я хочу писать о футболе, но о японском футболе для испанцев, чтобы предоставить такую информацию».

«Севилья» выиграла у «Атлетик» в Нервионе, получив в итоге 8 явных побед у себя дома. Гамейро забил первый мяч и закончил игру пенальти после того, как Кочовяк был удален с поля. «Атлетик» не повезло: несмотря на постоянное владение мячом, команда не реализовала ряд потенциальных голевых ситуаций», — это часть текста, написанного системой Narrativa.

Narrativa — одна из систем генерации контента, которая умеет преобразовывать сухие наборы данных в новости и описания спортивных событий. Схожих компаний довольно много. Одна из них — Narrative Science из США. Этой компании удалось получить довольно внушительные инвестиции от нескольких инвестиционных фондов США. Еще одна компания, Idealo, также разрабатывает систему автоматической генерации контента. Цель — автоматизировать написание новостей в 1–2 абзаца по ряду тем.

Такие гиганты, как Associated Press и Reuters также ведут работу по созданию собственных систем генерации контента, причем довольно успешно. Еще одно СМИ, Washington Post, недавно использовало систему генерации новостей по событиям Олимпийских игр.

Большинство таких систем, включая Narrativa, работают по узкому кругу тематик. Это, в основном спорт, финансы, экономика. Тем немного, но большинство из них востребованы читателями.

Основатели Narrativa познакомились в одном из испанских университетов, и решили начать совместную работу по созданию системы генерации контента, способную в некоторых случаях заменить человека.

«Представьте, что вы вводите новую информацию о спортивной игре и любимой команде. Также вы хотели бы узнать, как погода может повлиять на результат игры. В нашем случае вполне возможен вариант, когда система сможет собрать нужные данные самостоятельно и выдать это в виде новости или описания», — говорит основатель Narrativa. Давид Йоренте утверждает, что система сможет спрогнозировать как результат игры команд как при плохой, так и при хорошей погоде.

9177282647f2f1d43975c9b8bdb0780c.jpg

Цель Narrativa — это создание коротких новостей, которые не будут повторять друг друга. Каждая новость — описание оригинального события и результата спортивной команды. Пока что за работой системы приглядывает команда из трех журналистов, но уже в недалеком будущем, как надеется Йоренте, все будет работать в полностью автоматическом режиме.

Пока что неспособны полностью заменить людей и другие системы генерации автоматического контента. Они рассчитаны, как и говорилось выше, на создание контента, представляющего собой 1–2 абзаца текста. Журналисты не любят создавать подобного рода новости, поэтому и отношение к таким материалам соответствующее. Машинные тексты смогут снять часть скучных обязанностей с журналистов-людей.

Профессионалы же смогут работать на более ответственных направлениях, занимаясь написанием материалов другого рода. Скучные анонсы выполняют машины. В январе 2015 года компания AP объявила, что каждый квартал ее система автоматической генерации контента создает более 3000 коротких новостей финансового и экономического характера. Это в десятки раз больше, чем ранее могли выполнять журналисты-люди.

Йоренте с коллегами считают, что несмотря на некоторые сложности и скептицизм ряда представителей медиаиндустрии системы генерации контента будут постепенно развиваться и уже через несколько лет займут достойное место в деловой журналистике.

«Так и будет. Это станет стандартом через пять или десять лет», — говорит Йоренте.

«Вероятно, работа журналистов-людей станет более интересной. Особенно для тех, кто очень не любит писать сухие и скучные анонсы и новости».

© Geektimes