Механизмы управления репутацией в социальных сетях
Для чего нужно проводить исследования социальных сетей? Как доверие сказывается на принятии решений? Кому в первую очередь доверяют пользователи? На эти и другие вопросы отвечает профессор Университета Иннополис Джу Йонг Ли.
Анализ социальных сетей является самым популярным предметом исследований в последнее время, с чем согласится, я полагаю, большинство людей. Примерами социальных сетевых сервисов являются Facebook, Twitter, Instagram, e-mail-службы ― в нашей жизни очень много приложений социальных сетей, и я думаю, что трудно найти кого-то, не имеющего аккаунта хотя бы в одной из них.
Фактически социальные сети ― точнее, аудитория пользователей, которых они привлекают, ― составляют наибольшую совокупность пользователей в истории интернета. Это означает, что у нас есть очень много данных об активности в социальных сетях, о поведении людей в социальных сетях и об их структуре. Поэтому мы как исследователи пытаемся использовать этот огромный массив данных ― у нас есть действительно большие данные (Big Data), и задача состоит в том, чтобы проанализировать их. Так что основное внимание следует уделять обработке этих данных, а не самому по себе сбору данных.
Итак, у нас есть данные социальных сетей, и теперь я хочу представить исследовательскую задачу, над которой я работаю: расчет репутации в социальных сетях. Полагаю, большинство людей знакомо с понятиями «репутация» и «доверие». На самом деле я не хотела бы углубляться в дискуссию относительно понятия «доверие», потому что это вопрос философский. Иногда люди не находят согласия в том, что оно означает, потому что некоторые считают доверие очень личным понятием, которое не может быть выражено цифрами, так что я просто буду пользоваться этим понятием в общепринятом смысле. Приведу пример: на Amazon.com люди приобретают товары разных продавцов, также в интернете есть много других коммерческих площадок, и если у вас как у покупателя нет доверия, доверия к самой системе или продавцу, то вы не можете ничего приобретать онлайн, ведь для этого необходимо доверие. Можно сказать, что доверие побуждает людей к каким-то действиям, способствует принятию решений. Без доверия невозможно принимать решения, нельзя решить положить деньги в банк или предпринимать другие действия, для которых нужно доверие к внешнему миру. В социальной сети, например в Facebook, люди делятся многими вещами, но очевидно, что никто не захочет делиться личной информацией или фотографиями с кем-то, кому не доверяет. Поэтому тем или иным способом мы хотим рассчитать репутацию друзей или тех, с кем пользователь связан в социальных сетях, ведь люди делятся личной информацией или знаниями только с теми, кому доверяют. Именно это стало для нас мотивом к расчету репутации. Полагаю, репутация является одним из показателей, которые отражают доверие. Так что я использую в своем исследовании понятие репутации, а не доверия, так как доверие, на мой взгляд, является более абстрактным понятием.
Я работаю над вычислением репутации друзей или «соседей» пользователя. Я использую термин «соседи», а не «друзья», потому что друзья есть только на Facebook. Для вычисления репутации «соседей» пользователя в моем алгоритме я использую три фактора. Первый называется «чистые рекомендации». Многие статистические данные показывают, что люди, как правило, доверяют рекомендациям тех, кого они знают и кому доверяют. Так что в моем алгоритме вычисления репутации я хочу рассмотреть мнения «соседей», когда пользователь пытается определить репутацию другого пользователя. Но мнения всех «соседей» неравноценны, потому что в реальной жизни мы прислушиваемся к кому-то больше, чем к другим. Например, если у вас доверительные отношения с семьей — к ним вы прислушаетесь больше, чем к друзьям.
Таким образом, есть определенные степени доверия, с которыми вы относитесь к другим людям.
В социальной сети они выражаются степенями вершин графа, то есть числом узлов, с которым связан данный узел. И вы как пользователь склонны больше доверять тому пользователю, у которого эта степень выше других, просто потому, что ему доверяет больше людей. Так что я использую степень вершины как показатель доверия.
Итак, мнения «соседей» собираются и взвешиваются в соответствии с их степенями в топологии сети. И вторым фактором при вычислении репутации является частота взаимодействий, поскольку репутацию только тогда можно вычислить, когда в социальной сети у вас есть взаимодействия. В вычислении репутации важно и число взаимодействий, и как часто они совершаются, и как быстро число взаимодействий растет. Есть большая разница в сравнении с тем, совершаете вы только одно взаимодействие с друзьями или совершаете постоянные повторяющиеся взаимодействия с одним из ваших друзей. Очевидно, большее число взаимодействий может давать больше информации, и если взаимодействия часто повторяются или скорость взаимодействий возрастает, мы можем сделать вывод о большем доверии в таких взаимодействиях. Поэтому частота взаимодействий также является взвешенным фактором при вычислении репутации.
И последним фактором, который мы учитываем при вычислении репутации, является функция «разрушения временем». Проще говоря, информация распадается с течением времени, так что более свежая информация будет, как правило, важнее старой информации. Можно также сказать, что это явление памяти, потому что люди склонны забывать информацию со временем. В вычислении репутации это интерпретировано так: пользователи принимают во внимание самые последние взаимодействия или обратную связь «соседей» вернее, чем информацию или взаимодействия, которые произошли давно, потому что они уже забылись.
Мы приходим к выводу, что функция «разрушения временем» зависит от приложения, потому что одни приложения очень чувствительны ко времени, и информация разрушается очень быстро, а в других не имеет значения, случилось взаимодействие давно или совсем недавно. Для каждого приложения следует выбрать соответствующую функцию «разрушения временем». Сочетание этих трех факторов вместе с фактической обратной связью в отношении недавнего взаимодействия с пользователем определяет для вас репутацию этого пользователя. Разумеется, репутация должна обновляться каждый раз, когда вы производите новое взаимодействие, ведь даже если вы хорошо взаимодействовали с кем-то, а затем его репутация испортилась, то в следующий раз при взаимодействии с этим пользователем у вас все еще останется память или опыт об этом. Репутация будет подтверждаться и обновляться все то время, что вы совершаете взаимодействия.
С этим связана другая задача. Я использую степени вершин для пользователей в социальных сетях как один из факторов при вычислении репутации. Многие принимают как должное возможность использовать степени вершин в социальных сетях, так как они известны, но большую часть времени степени вершин пользователей нам неизвестны, ведь в жизни мы на самом деле не знаем, сколько окружающих используют Facebook, и мы необязательно знаем, сколько друзей есть у наших собственных друзей. Поэтому, чтобы быть в состоянии использовать информацию о степенях вершин при вычислении репутации, и если эта информация недоступна для нас, мы стараемся самостоятельно сделать оценку степеней вершин «соседей». Это представляет собой проблему оценки степени вершин. Большинство людей, я полагаю, применяют структурный подход, пытаясь оценить степени вершины на основе структуры самой сети. Но в нашем исследовании я пытаюсь оценить степень «соседей», применяя подход микроуровня, так как я полагаю, что мы не в состоянии видеть всю структуру самой сети, но мы должны иметь какую-то информацию, на основе которой могли бы сделать оценку степени.
В нашем случае мы используем активности, которые называем наблюдениями, то есть действия ваших «соседей» (в случае Facebook — друзей), видимые для пользователя.
Я использую Facebook как самый, полагаю, известный пример социальной сети. В Facebook вы видите справа ленту с действиями друзей, так что вы видите, как ваш друг делает пост на чужой стене, комментирует или оценивает фото. И на основе этих действий мы пытаемся оценить, сколько у пользователя друзей. В основе этого лежит предположение, что чем больше у вас друзей, тем больше при анализе сети у вас будет таких действий. На основании наблюдений мы считаем каждое наблюдение примером испытания по схеме Бернулли, так что при обновлении наших представлений о степенях «соседей» мы используем лучшее распределение. Еще раз подчеркну: это повторяющийся процесс, вы обновляете представления о степени вершины «соседа» каждый раз, когда совершаете новое наблюдение за другом или «соседом». Поскольку нам известно, что для большинства социальных сетей степени вершин имеют степенно́е распределение, мы применяем степенно́е распределение при перераспределении наших представлений о распределении степеней. Отсюда мы получаем первичные результаты, используя данные Facebook, действия на стене в качестве наблюдений. Мы можем показать, что на самом деле такого рода алгоритм оценки степеней вершин гораздо лучше, чем просто подсчет количества наблюдений или действий в таких сетях.
Эту задачу по оценке степеней вершин можно с легкостью применить в задаче диффузии информации в социальных сетях. Многие сейчас интересуются информационной диффузией в социальных сетях. Маркетологи, например, хотят узнать о течении информации в социальных сетях, чтобы привлечь для продвижения наиболее влиятельных пользователей. Поэтому важно выяснить источник информации в социальной сети и найти наиболее авторитетных и влиятельных пользователей. Таким образом, оценка степеней вершин является одной из важнейших тем исследований социальных сетей.
Полный текст статьи читайте на Postnauka.ru