ИИ научили распознавать сарказм в Twitter по смайликам
Создатели «Симпсонов», как и во многих других случаях, предсказали появление этого изобретения задолго до его создания реальными учеными
Некоторые действия человека остаются непостижимыми для компьютера. Но часть поведенческих особенностей компьютерные системы научились распознавать, и весьма неплохо. Например, когнитивная система IBM Watson может определять эмоциональный тон письма. Научить компьютер определять эмоции довольно сложно, но возможно. На днях была представлена еще одна система, которая способна понимать сарказм. В данном случае речь идет о сарказме в сообщениях из Twitter. Разработчики этой системы утверждают, что она может определять эмоциональное наполнение сообщений различных пользователей лучше, чем в большинстве случаев это делает сам человек.
Зачем все это нужно? В первую очередь, для того, чтобы компании могли определять отношение пользователей социальных сетей к своим продуктам и себе самим. Сейчас для этого используются ключевые слова и некоторые другие методы. Но если компьютер сможет определять эмоции людей, отправляющих сообщений, то это может значительно улучшить эффективность работы компаний. Кроме того, если машины будут уверенно определять эмоции людей, это поможет пользователям понимать, какие эмоции использовал другой человек, который отправил, например, сообщение электронной почты.
С самого начала разработчики «эмоционального» алгоритма хотели создать систему, которая сможет обнаруживать посты расистского содержания в Twitter. Но вскоре после готовности алгоритма команда проекта поняла, что он дает много ложных срабатываний. То есть машина не понимала, например, шуточных или саркастических сообщений, и принимала все за чистую монету. Так появилась необходимость обучить ИИ распознавать хотя бы сарказм.
Этот алгоритм использует глубокое обучение, которое становится все более распространенным. В качестве ключевых индикаторов специалисты решили использовать не слова, а смайлики. Да, они содержатся сейчас в большинстве сообщений, так что по ним можно примерно понимать настроение самого твита или иного сообщения пользователя в социальной сети. Как только исследователи смогли достичь желаемого, они поняли, что ИИ работает на ура.
«Поскольку в онлайн-режиме мы не в состоянии использовать невербальные сигналы, помогающие понять то, о чем мы говорим, мы стали использовать смайлики. А нейронная сеть была обучена понимать связь эмоционоального наполнения твита и содержащихся в этом сообщении смайликов», — заявил Ияд Рахван, процессор из MIT Media lab, глава исследовательской группы.
Обучение нейросети было действительно масштабным. Для того, чтобы алгоритм научился правильно определять связь между эмоциональным наполнением сообщения и эмодзи, ученые собрали базу из 55 млрд твитов, выделив затем 1,2 миллиарда сообщений со смайликами (всего 64 типа популярных смайликов). Изначально они обучали систему прогнозировать, какой смайлик стоит использовать в том либо ином сообщении, в зависимости от того, веселое оно, грустное или какое-либо еще. После этого систему начали натаскивать на идентификацию сарказма по наличию в сообщении уже изученных компьютером паттернов.
Как оказалось, нейросеть научилась определять сарказм гораздо лучше, чем сами специалисты, которые ее разрабатывали. Система правильно определяет сарказм в 82 случаях из ста. Человек, в среднем — в 76 случаях из ста.
Нейросеть также обучили добавлять смайлики в сообщения с определенным эмоциональным настроем. И с этой задачей компьютер тоже справился неплохо. Опробовать работу алгоритма можно вот на этом сайте. Здесь же можно помочь ученым усовершенствовать свой алгоритм, отправляя твиты, снабженные нужными смайликами. Это делает работу нейросети еще более точной.
Некоторые специалисты, которые успели ознакомиться с работой ученых, заявили, что использование смайликов для обучения нейросети и создания «эмоционального алгоритма» — отличная идея. Что касается сарказма, то здесь может быть проблема — дело в том, что не так и много людей способны идентифицировать сарказм. Некоторые так и вообще не знают, что это такое. Поэтому сложно сказать, насколько полезной может быть нейросеть, которая способна определять сарказм. Но раз она уже есть, то значит, это кому-нибудь нужно. Кроме того, на основе этой работы можно развивать и другие проекты, более универсальные.