Ученые из Перми запатентовали программу для психолингвистического анализа пользователей соцсетей
По информации агентства ТАСС, сотрудники Пермского государственного национального исследовательского университета (ПГНИУ) получили патент на компьютерную программу, с помощью которой можно составить психологический и лингвистический портрет пользователей на основании опубликованных ими комментариев в различных социальных сетях.
Подобные исследования в России ведутся уже давно, но существующие на текущее время системы оценки поведения пользователей в социальных сетях оценивают в основном только лайки и репосты пользователей. Ученые из Перми решили исследовать комментарии пользователей.
Разработанная лингвистами и математиками из Перми программа называется BFI CNN Detector. На данный момент точность используемого в программе алгоритма определения социальных и поведенческих параметров авторов комментариев составляет 70%.
Проведение данного исследования и написание программы BFI CNN Detector заказало Министерство образования и науки РФ. В настоящее время этот программный продукт создан, запатентован и зарегистрирован Федеральной службой по интеллектуальной собственности РФ. Используемый для создания программы язык программирования — Python.
В процессе разработки алгоритма программы ученые из ПГНИУ изучали, что именно и каким образом пишут пользователи в комментариях в различных социальных сетях. В базу данных BFI CNN Detector внесено более 21 тыс. различных комментариев пользователей, которые проанализировали по стилистике, жанрам, информативности. Алгоритм программы при помощи нейронной сети, включающей в себя сверточные слои, может классифицировать вид и стиль комментариев более чем из 150 разных категорий. Кроме этого, оценивает такие параметры пользователей, как возраст, пол, количество друзей, интенсивность написания комментариев, количество постов и психологические черты, которые исследователи собирали с помощью опросника The Big Five Inventory. На основе полученных данных ученые составили психолингвистические портреты для каждого исследуемого пользователя.
По словам профессора кафедры теоретического и прикладного языкознания ПГНИУ Константина Белоусова, в ходе исследований ученые смогли установить некоторые закономерности:
- в текстах мужчин почти нет извинений, а у женщин они частотно присутствуют;
- пользователи-мужчины, для которых характерна недобросовестность, часто в своих текстах используют сарказм и иронию;
- пользователи, которые часто шутят, проявляют враждебность и признаки интровертности (сосредоточенности на внутреннем мире);
- пользователи, которые проявляют сочувствие, чаще всего доброжелательны и консервативны.