Исследователи из Бразилии представили модели анализа нравственности на основе языка07.12.2020 15:17

Исследователи из Бразилии разработали три модели, которые могут описать моральные принципы людей на основе языка, который они используют. Модели оценивают выбор слов человека, чтобы определить его позицию по пяти ключевым нравственным принципам.

Ивандре Парабони, адъюнкт-профессор Школы искусств, естественных и гуманитарных наук Университета Сан-Паулу, руководил исследованием. Его команда решила сосредоточиться на теории моральных основ, обычно используемой социологами. Она постулирует несколько ключевых категорий морали, включая заботу, справедливость, верность, авторитет и чистоту.

По словам Парабони, цель новых моделей состоит в том, чтобы сделать вывод о ценностях человека, просто взглянув на его тексты, независимо от того, чему они посвящены.

Для разработки и проверки моделей команда Парабони раздала анкеты более чем 500 добровольцам. Участников попросили оценить восемь тем (например, однополые браки, владение оружием, наркополитику) с помощью баллов (от 0 = «полностью против» до 5 = «полностью за»). Их также попросили написать пояснения к этим оценкам.

Затем люди-судьи дали свою собственную оценку подмножеству объяснений участников. Это определило, насколько хорошо другие люди могут делать выводы из чужого текста. «Понимание сложности задачи с человеческой точки зрения дало нам более реалистичное представление о том, что вычислительные модели могут или не могут делать с этим конкретным набором данных», — говорит Парабони.

Используя мнения участников исследования, исследовательская группа создала три алгоритма машинного обучения, которые могут оценить язык, используемый в утверждении каждого участника. В моделях анализировалась психолингвистика (эмоциональный контекст слов), слова и словосочетания.

Первые две модели, которые фокусируются на отдельных словах, используемых автором, были более точными, чем подход глубокого обучения, который анализирует последовательности слов.
Парабони добавляет: «Подсчет слов, например, того, как часто человек использует такие слова, как «грех» или «долг», в высшей степени раскрывает их моральные принципы, то есть с большей точностью предсказывает степень их заботы, справедливости, лояльности, авторитет и чистоту».

Команда планирует включать в свои модели другие формы лингвистического анализа. Теперь она изучает модели, которые больше фокусируются на тексте независимо от его автора, чтобы представить способ анализа данных из Twitter.

В ноябре прошлого года стало известно, что Росмолодежь предложила использовать Институт развития интернета как оператора субсидий для производства социально значимого контента в интернете для пользователей до 35 лет. Предполагалось, что видеоролики, мультфильмы, аудиотрансляции, веб-сериалы, подкасты, проекты в соцсетях, а также игровые приложения, образовательные программы, информационные ленты будут размещать в соцсетях «ВКонтакте», «Одноклассники», Instagram, Facebook, TikTok, на YouTube и других молодежных интернет-площадках. На эту работу в ближайшие три года российские власти планировали выделить 2,4 млрд рублей.

См. также: