Артур Хачуян: «Настоящая Big Data в рекламе»01.01.2020 21:38

14 марта 2017 года в лектории BBDO выступил Артур Хачуян, генеральный директор Social Data Hub. Артур рассказал про интеллектуальный мониторинг, построение поведенческих моделей, распознавание фото- и видеоконтента, а также о других инструментах и исследованиях Social Data Hub, которые позволяют таргетировать аудиторию, используя социальные сети и технологии Big Data.

Артур Хачуян (далее — АХ): — Здравствуйте! Всем привет! Меня зовут Артур Хачуян, я руковожу компанией Social Data Hub, и мы занимаемся различным интересным интеллектуальным анализом открытых источников данных, инфополя и делаем всякие интересные исследования и так далее.

И сегодня коллеги из BBDO Group попросили рассказать о современных технологиях анализа больших данных, больших и не очень данных для рекламы: как это применяется, показать несколько интересных примеров. Я надеюсь, вы будете задавать вопросы прям по ходу, потому что я могу начать нудить и не раскрывать сути и так далее, так что не стесняйтесь.

Собственно, основные направления, где-то когда-либо применялись какие-то «околобигдатные» решения», они все понятны — это таргетирование аудитории, анализ, проведение каких-то анализ-маркетинговых исследований. Но всегда интересно, какие дополнительные данные можно найти, какие можно найти дополнительные смыслы после применения анализа.

Зачем нужны технологии для рекламы?

С чего мы начнём? Самое понятное — это реклама в социальных сетях. Сегодня снял с утра: почему-то «Вконтакте» считает я именно эту рекламу должен видеть… Хорошо это или плохо — это уже второй вопрос. Видим, под категорию призывников я попадаю точно:

Самое первое и интересное, что можно взять как технологическое решение… Первое, что я хотел решить, перед тем как мы начнём, — определиться с терминами: что такое открытые данные и что такое большие данные? Потому что у всех людей своё понимание на этот счёт, и я никому не хочу навязывать свои термины, но… Просто чтобы не было никаких расхождений.

Лично я считаю, открытые данные — все те, до которых я могу дотянуться без какого-либо логина или пароля. Это открытый профиль в социальных сетях, это поисковая выдача, это открытые реестры и т. д. Большие данные, в моём собственном понимании, я вижу так: если это табличка с данными — это миллиард строк, если это какое-то файловое хранилище — это где-то петабайт данных. Остальное в моей терминологии — это не большие данные, а что-то около.

Высокоточное профилирование и скоринг профилей

Идём по порядку. Самое первое и интересное, что можно придумать из анализа открытых источников данных — это высокоточное профилирование и скоринг профилей. Что это? Это история, когда по вашему аккаунту в социальной сети можно предсказать не только кто вы, не только ваши интересы.

Но сейчас, объединяя различные источники, можно понять средний уровень вашей зарплаты, сколько стоит ваша квартира, где она находится. И все эти данные можно использовать буквально из подручных средств. Например, если взять ваш аккаунт в социальной сети, посмотреть, скажем, где вы живёте, где вы работаете; понять, в какой секции бизнеса находится компания, в которой вы работаете; взять выгрузку похожих вакансий с HH и «Суперджоба», если вы аналитик, менеджер и т. д.; посмотреть, где вы живёте (базу, скажем ЦИАНа), понять, сколько стоит аренда жилья в этом месте, сколько стоит покупка жилья в этом месте, предсказать примерно, сколько вы зарабатываете. Дальше по вашим соцсетям можно понять, сколько вы путешествуете, где вы находитесь, насколько вы лояльны к работодателю.

Соответственно, из такого огромного количества метрик мы можем сделать всё, что угодно. Мы можем представить вам продукт, который вам интересен. Представляете, интернет-магазин? Вы заходите туда — этот интернет-магазин отлавливает ваш аккаунт в социальной сети и говорит вам: «Маша, ты только что рассталась с парнем, вот тебе такие-то, определённые продукты». Это не ближайшее будущее…

Как определяют геоположение человека?

Ответы на вопросы из аудитории:

Обычно точным местом жительства считается 80% всех check-in«ов. Но для людей, которые не чекинятся нигде — несколько вариантов: либо чек-ин, либо геопозиция, либо это анализ постов и публикаций за весь период времени, когда что бы то ни было писал человек… И где-нибудь, да всплывёт что-нибудь типа «Хочу купить коляску возле Академической» или «Видел тут недавно граффити на стене некрасивое». То есть практически у 80% людей можно определить их геоположение, их место работы и их место жительства по данным либо по метаданным, которые можно собрать из социальных сетей.
Это, опять же, анализ постов. В самом простом понимании — это анализ чек-инов и геолокаций в соцсетях, которые не удаляют метаданные jpeg«а (можно по ним что-то разобрать). Но для оставшихся людей — это обычно текстовые трансляции: либо человек «светит» своё местоположение, когда пишет о чём-то, либо он «светит» свой телефон, по которому можно найти какую-нибудь его рекламу на «Авито» или его аккаунт на «Авто.ру». По этим данным можно объединить (например, «Я продаю автомобиль около Маяковской») и примерно предположить это.
Обычно люди публикую это в социальных сетях. Мы работаем только с открытыми источниками и здесь речь идёт исключительно об открытых источниках. Обычно публикуют объявления, то есть процентах в шестидесяти случаев самая частая история, когда люди «светят» свой актуальный сотовый номер телефона — это объявления о продаже чего-то. Либо в каких-то группах человек пишет («Я продаю там то-то, то-то), либо куда-то заходит.
Да! Комментируют обычно, типа: «Ответьте мне или киньте смс-ку, позвоните мне на номер. Такое очень часто бывает с людьми, которые что-либо продают, покупают в социальных сетях, с кем-то коммуницируют… Соответственно, по этому номеру потом можно привязать к нему его профиль на ЦИАНе, если он когда-то что-то публиковал, либо, опять же, на «Авито». Это просто самые популярные, топ источников, он дальше будет — это «Авито», ЦИАН и так далее.
Имеется в виду онлайн-магазин. Дальше будет технология распознавания лиц и мэтчинга профилей (мы о ней поговорим). Чисто теоретически такое можно применить и для офлайн-магазина. И вообще, моя большая мечта — когда появятся уличные баннеры, когда ты проходишь мимо камеры, она «трэчит» лицо. Но законодательно это дело запретят, потому что это нарушение приватности. Я надеюсь, что рано или поздно это будет.
У меня из личного опыта. Очень часто, когда человек тебе что-то пишет, ты оперируешь каким-то фактами из его жизни, которые ты вроде как не должен узнать… Люди в большинстве случаев пугаются. Но! Исходя из статистики за последнее время, на 14% уменьшилось количество закрытых аккаунтов в социальных сетях. Количество фейков увеличивается, количество открытых аккаунт растёт — люди всё больше двигаются к открытости. Я думаю, что через 3–4 года они перестанут так остро реагировать на то, что кто-то знает о них информацию, которую он потенциально не должен знать. Но на самом деле это очень легко получить, посмотрев его стену.

Что можно взять из открытых источников?

Примерный список вещей, которые можно понять с достаточно высокой достоверностью из открытых источников, — он есть. На самом деле есть ещё больше всяких разных метрик; это зависит от заказчика таких исследований. Есть какое-нибудь HR-агентство, которому интересно, ругаешься ли ты матом в социальных сетях или где-то в публичном пространстве. Кому-то интересно, ставишь ли ты лайки под публикациями Навального или, наоборот, под публикациями «Единой России», или какой-то порнографический контент — такие вещи достаточно часто случаются.

Основные из них — это семейные ценности, примерная стоимость квартиры, жилища, поиск автомобиля и так далее. По этому всему людей можно разбить по социальным группам. Это пользователи московского «Тиндера», кто они (по их картинкам, найденным их аккаунтам в «Фейсбуке»); на основании их интересов разбиты по всяким социальным группам:

Если двигаться ближе к рекламе, то мы уже потихоньку ушли от стандартного таргетинга рекламы, когда ты выбираешь в условном «Вконтакте», что тебя интересуют мужчины 18 лет, подписанные на определённые группы. У меня дальше есть такая картинка, сейчас вам покажу:

Суть в том, что большинство текущих сервисов, которые занимаются анализом, в принципе люди, которые занимаются анализом социальных сетей, именно занимаются анализом интересов… Первое, что приходит в голову людям — это про проанализировать топ групп своих подписчиков. Возможно, с кем-то это работает, но лично я считаю, что это кардинально неверно. Почему?

Ваши лайки собирают и анализируют

Вот возьмите сейчас свои телефоны, посмотрите на свой топ групп — обязательно там будет более 50% групп, о которых вы уже забыли, это какой-то контент на самом деле нерелевантный для вас. Вы его совсем не потребляете, но тем не менее система будет стрейчить вас по ним: что вы на рецепты подписаны, на какие-то популярные группы. То есть вы нарушите систему, которая анализирует ваш профиль, и ваши интересы будут не оправданны.

Двигаясь дальше… Что там? Мы предполагаем, что делают остальные люди. Самый, на наш взгляд, адекватный способ оценить интересы пользователей — это лайки. Например, во «Вконтакте» нет ленты лайков, и люди думают, что никто не знает о том, чему они ставят лайки. Да, часть лайков введена в «Инстаграме», в «Фейсбуке» мы что-то видим, но большинство контента в определённых группах не транслирует это общей лентой, и люди живут и думают, что никто не узнает, на что они ставят лайк.

И, собрав определённый, интересующий нас контент какого-то содержания, собрав эти посты, собрав эти лайки, потом по этой базе проверив этого человека, мы можем с высокой точностью определить, кто он, какая у него судьба, чем он интересуется. Определить точно в определённую социальную группу и провзаимодействовать с ним.

Покупка авто меняет поведение

У меня есть такой пример. Сразу оговорюсь, что у меня примеры околорекламные и околомаркетинговые, потому что, сами понимаете, большинство кейсов защищают NDA и так далее. Но всё-таки будет много чего интересного. Значит, история с этими людьми: это мужчины, которые купили автомобиль в промежутке 2010 по 2015 год. То, как изменилось их социальное поведение в сети, отмечено цветом. Процент девушек в подписчиках изменился, подписался на «пацанские» паблики, нашёл постоянного сексуального партнёра…

Всё это дело разбито по маркам автомобилей и по количеству людей. Отсюда можно сделать много интересных выводов о поведении людей, как это всё работает. Могу сказать, что «Порш Кайенн» и посаженная «Приора» по количеству привлечённой аудитории практически одинаковы. Качество этой аудитории, их поведение разные, но количество примерно одинаковое. Вывод отсюда можно сделать, ближе к вашему рынку, какой угодно. Продаёте вы «Ауди» — делаете слоган «Купи «Ауди» — «уедь» от родителей!» и так далее.

Это да, смешной пример к тому, что поведение людей, основанное на анализе лайков, на основании того из какой группы в какую они переходят, какой они контент анализируют — практически со 100% вероятностью даёт понять, кто вы. Потому что, если вы не обладаете доступом к сетевому трафику, не читаете личные сообщения, лайки всегда подскажут, кто этот человек — беременная женщина, мама, военный, полицейский. А для вас, как для человека, который может размещать рекламу, это большое попадание в цель.

Ответы на вопросы аудитории:

Каждый столбик — это количество человек данного автомобиля; как изменился паттерн их поведения. Вот смотрите: люди, купившие «Порш Кайенн» — 550 примерно человек (жёлтое), процент девушек в подписчиках увеличился.
Выборка — это пользователи социальных сетей «Вконтаке», «Фейсбук», «Инстаграм» с 2010 по 2015 год. Единственное уточнение: здесь выбраны машины, которые с более чем 80% точностью можно определить на фотографиях с помощью определённых инструментов.
За определённый промежуток времени его машина (ну, то есть не его, это мы уже оставляем на поверку социальных сетей)… За определённый промежуток времени человек постоянно с автомобилем фотографировался, находился с ним, публикации были разные, фотографии были с разных углов и так далее. Там дальше будет картинка, какие люди с какими машинами фотографируются и… Да, это второй вопрос — доверие данным социальных сетей.
Раз уж мы его подняли — к сожалению, не всегда данные социальных сетей верны. Люди не всегда склонны публиковать свою информацию. Лично я проводил такое исследование: сравнивал количество выпускников московских ВУЗов с тем, какое количество людей зарегистрировано в социальных сетях. В среднем на 60% людей больше в социальных сетях зарегистрировано — выпускников МГУ за определённый год по определённым специальностям, нежели их на самом деле в принципе существует. Так что да — здесь, естественно, есть процент ошибок, и никто это не скрывает. Здесь просто за основу взяты те автомобили, которые можно с более чем 80% вероятностью определить.

Список источников для обучения модели

Вот примерный список источников, который можно использовать, который используется для того, чтобы с большой достоверностью определить социальный профиль человека, кто он.

С социальных сетей мы берём профиль, с ЦИАНа — стоимость квартиры примерно, «Хед-Хантер», «Суперджоб» — это средняя зарплата для данного человека. Надеюсь, здесь нет представителей «Хед-Хантера», потому что они считают, что не очень хорошо у них эти данные брать. Тем не менее это средняя зарплата по определённым регионам для определённых типов деятельности по вакансиям.

«Авито», «Авто.ру»: очень часто люди, когда засветили свой телефон, он у них обязательно есть (в большом количестве случаев) хоть что-то на «Авито», либо на «Авто.ру», или ещё на нескольких сайтах, с которых можно понять, кто они. Если по этому телефону продавали коляску или автомобиль… Росстат и ЕГРЮЛ — это всё-таки больше реестры, с помощью которых можно ранжировать компанию-работодателя — по какой-то формуле, по модели, которую может задать любой человек (можно примерно определить деньги этого человека и т. д.).

«Тиндер» помогает собирать данные о положении людей

Плюс, есть такая интересная штука (как вариант, очень смешно в исследовании) — это, опять же, сбор данных с московского «Тиндера» с помощью ботов для этого «Тиндера». Определялось расстояние до людей, а дальше определялось их примерное местоположение.

Задачей этого исследования было определить количество аккаунтов «Тиндера» на территории государственных учреждений — в Думе, прокуратуре и так далее. Но вы себе, как рекламодатель, можете представить как угодно: это может быть, например, «Старбакс» или ещё кто-то… То есть количество людей того же «Тиндера», которые пьют у вас кофе, что-то заказывают, находятся в магазинах. По поводу этого геоположения: так можно поступить с любым сервисом.

Ответ на вопрос из аудитории:

«Тиндер»? Вы не знаете? «Тиндер» — это такое приложение для знакомств, где вы просматриваете фотографии (влево-вправо), и это приложение показываем вам расстояние до человека. Если вы с трёх разных точек получите расстояние до этого человека, вы можете примерно (+ 5–7 метров) определить местоположение. В данном случае, для определения на территории прокуратуры или Госдумы, это не так сложно. Но, опять же, это может быть ваш магазин, это может быть что угодно.

У нас, например, давно-давно был такой кейс (не исследование), когда мы получали от одного из операторов сотовой связи данные о плотности потока, данные о плотности перемещения сотовых точек, и эта вся информация накладывалась на координаты рекламных щитов, находящихся на автомагистралях. И задача сотового оператора — определить, какое примерно количество человек проезжает и потенциально может видеть эту щитовую рекламу.

Если здесь есть специалисты по щитовой рекламе, вы можете сказать: супер-достоверно нельзя понять — кто-то едет, кто-то не посмотрел, кто-то посмотрел… Тем не менее это пример того, как 20 миллиардов полигончиков таких по Москве, на которых есть плотность этих людей в каждый час по определённым маршрутам… Можно посмотреть, мимо чего эти люди проходили в любой момент и примерно оценить пассажиропоток.

Ответ на вопрос из аудитории:

Никто такие данные не даёт. Мы проводили такое исследование для одного из операторов, это исключительно внутренняя история, поэтому она, к сожалению, не представлена в виде картинок. Но зачастую крупные рекламные агентства не имеют проблем с тем, чтобы обратиться к оператору. По крайней мере, в Москве есть много прецедентов, когда, например, страховые компании обращаются к компаниям типа «ГетТакси», которые дают обезличенные данные о том, какой возраст водителя, как они ездят (хорошо — плохо, лихачат — нет), для того чтобы прогнозировать полисы и так далее. Все с этим борются, но на каком-то внутреннем уровне анонимные данные дать — я думаю, что такой проблемы нет ни у кого.

Распознавание изображений и образов

Идём дальше. Моё любимое — распознавание изображений. Здесь будет небольшой кусочек про поиск людей по лицам, но мы в основном эту часть не берём. Мы берём именно распознавание образов и определения, что на этом изображении — марка автомобиля, цвет его и так далее.

У меня есть такой шуточный пример:

Было такое исследование по поиску татуировок в различных социальных сетях. Соответственно, это же можно применить к любому бренду, к любому визуальному образу, практически к любому визуальному образу. Есть те, которые нельзя определить достаточно достоверно (мы их не берём).

Вот моё любимое. Автомобильные бренды достаточно часто обращаются за такой задачей, потому что их задача, например, — найти всех владельцев каких-нибудь BMW X6, понять, кто они, как они между собой связаны, чем они интересуются и так далее. Это к вопросу о том, с какими автомобилями фотографируются люди в социальных сетях.

Здесь вообще не было никакой фильтрации: предмет их, автомобиль не их; просто такая разбивка автомобилей — возраст и так далее. Но визуальное распознавание образов используется достаточно часто: это и поиск беременных женщин, и поиск логотипов брендов в каком-то масс-медиа (кто и что постит).

Самый мой любимый кейс (которым пользуются различные рестораны): какие роллы постят в социальной сети. Смешная штука, но на самом деле это позволяет много чего интересного понять, во-первых, о собственных покупателях: кто к тебе пришёл и почему они это сделали. Потому что не секрет, что в суши-барах большинство людей (не буду говорить «девушек») фоткается, чтобы зачекиниться, сфотографировать что-то и т. д.

Бренд этим может пользоваться. Бренду интересно, какую именно продукцию ему нужно красиво фотографировать и выкладывать, какие люди туда приходили. Такую вещь можно провернуть практически с чем угодно, начиная от еды.

Распознавание образов на видео

Ответ на вопрос из аудитории:

На видео — нет. Оно у нас есть в тестовом режиме. Мы пробовали такую технологию, но получается, что… Она достаточно хорошо распознаёт всё дело с видео, но применение этому мы никуда не нашли. Пока. Кроме как анализ того, сколько, какие видеоблогеры где-то говорят… Было такое исследование. Сколько их лица встречаются, как часто. Но для брендов пока не придумали, куда это придумать. Возможно, когда-нибудь это придёт.

Опять же, это еда, это могут быть беременные женщины, мужчины (не беременные), автомобили — всё, что угодно.

Как вариант, было такое новогоднее исследование для одного СМИ. Тоже далеко от рекламы, но тем не менее. Это — какую еду люди постили на Новый год:

Оно здесь ещё разбито по возрасту. Можно просмотреть такую корреляцию, что молодые люди еду в основном заказывают, взрослые в основном делают традиционный стол. Шуточная вещь, но, представляя её себе как владелец бренда, вы можете оценить большое количество вещей: кто и как с вашей продукцией обращается, что о ней пишут. Зачастую не всегда люди упоминают сам бренд в тексте, и традиционные мониторинговые системы аналитические не всегда могут понять, найти это упоминание бренда исключительно потому, что в тексте он не упомянут. Или в тексте он написан с ошибками, нет хэш-тегов или что-то угодно.

Фотографии видно. С фотографией можно понять, центральный ли это объект кадра, не центральный объект кадра. Дальше можно посмотреть, что этот человек написал. Но чаще всего это используется как поиск потенциальной аудитории, которая ездила на определённых автомобилях и так далее. А потом мы с этими автомобилями будем делать много чего интересного.

Ботов учат подражать человеку

Вот такой вариант применения подсчёта людей тоже был:

Бывает вариант сопоставления людей, когда нужно по каким-то фотографиям найти людей, понять их социальный профиль, кто они. Опять же, возвращаемся к вопросу о том, что если у нас стоит камера в офлайн-магазине, то это достаточно хороший способ понять, кто к вам приходит, кто эти люди, чем они интересуются, что их сподвигло к вам прийти.

Дальше самое интересное: если мы соберём их аккаунты в социальных сетях, поймём, кто эти люди, чем они интересуются, мы сможем (как вариант) сделать бота, похожего на этих людей; этот бот начнёт жить, как эти люди, и анализировать, какую рекламу он видит в различных социальных сетях. Это позволит достаточно точно понять, какие бренды на этого человека ориентированы. Это тоже достаточно частая история, когда необходимо не просто проанализировать, кто этот человек и какие у него интересы, а ещё и какую рекламу на него потенциально конкуренты ваши или другие заинтересованные люди таргетировать.

Анализ связей в социальных сетях

Следующая штука интересная: это анализ взаимосвязей между людьми. Сам, собственно, анализ связей в сети, эти сетевые графы — в этом нет вообще ни капли, ничего нового, это всем известно.

Но применение к рекламным задачам — это самое интересное. Это поиск людей, которые задают тренды, это поиск людей, которые распространяют информацию по определённым критериям внутри этой сети. Скажем, нас интересуют те же владельцы определённой модели БМВ. Собрав их всех вместе, мы можем найти тех, кто держит у себя в руках общественное мнение. Это необязательно блогеры автомобильные и так далее. Обычно это простые товарищи, которые сидят в различных пабликах, интересуются каким-то контентом и могут за очень короткий промежуток времени завлечь в эту зону ответственности, в зону интереса ваш бренд или кого-то интересующего для вас.

Здесь есть такой пример. Есть у нас потенциальные какие-то люди, связи между людьми. Здесь оранжевые — это люди, мелкие точки — это общие группы, общие друзья.

Если собрать все эти связи между ними, можно очень чётко посмотреть, что есть люди, у которых между собой есть большое количество общих групп, общих друзей, они там находятся между собой… А если эту же визуализацию разбить на группы по интересам, по контенту, который они распространяют, насколько они взаимодействуют друг с другом… Вот здесь можно посмотреть, что предыдущая картинка стала вот таким образом:

Здесь чётко выделились цветом группы. В данном случае это взяты студенты нашей магистратуры в Высшей школе экономики. Здесь видно, что фиолетовые / синие — это те, кто любят Transparency International, «Открытую Россию», паблики Ходорковского. Снизу слева — зелёные, те, кто любит «Единую Россию».

Можно посмотреть, что предыдущая картинка была вот такая (это просто связи между людьми), а стала чётко разграниченной. То есть все люди всегда связаны между собой, у них есть одинаковые интересы, они дружат друг с другом. Сверху одни, снизу другие, там ещё какие-то товарищи. И если каждый из этих маленьких подграфов отдельно провизуализировать с другими параметрами и посмотреть скорость распространения контента (грубо говоря, кто там что репостит), можно найти в каждой части одного-двух человек, которые всегда держат в руках общественное мнение, провзаимодействовав с которым, попросив отправить пост какой-то или ещё-что — можно получить отклик всей этой интересной аудитории.

У меня есть ещё один такой пример. Тоже граф: это сотрудники BBDO Group, найденные в соцсетях как пример. Выглядит как неинтересное, большое, зелёное, связи между ними…

Но у меня есть вариант, где между ними уже построены группы. Потом, если кому-нибудь будет интересно, есть интерактивная версия — можно покликать, посмотреть.

Сверху справа — те, кто любит Путина. Вот здесь фиолетовые — это дизайнеры; те, кто увлекается дизайном, чем-то таким интересным и так далее. Здесь белые штуки — это руководящий состав (видимо, я так понял); это люди, которые никак, в общем, не связаны, но работают примерно на одинаковых позициях. Остальное — это их общие группы, связи и так далее.

Брендам нужны не блогеры, а лидеры мнений

Берём этих людей и находим — дальше рекламное агентство, рекламная компания решает сама: она может денег дать этому человеку, чтобы он как-то провзаимодействовал с этим контентом, ещё что-то, или направить на них свою определённую рекламную кампанию. Тоже достаточно часто применяется, особенно сейчас, потому что все бренды хотят работать с блогерами, хотят, чтобы продвигали их контент, а рекламные агентства не очень хотят контактировать (ну, бывает такое).

И реальный выход из этой ситуации — найти людей, которые не блогеры, не бьюти-блогеры, а например, какие-то реальные существа, которые взаимодействуют с этим брендом, могут в каком-нибудь убогом своём паблике «Мэйл.ру Ответы» написать, получить определённое количество просмотров. Эти люди, которые постоянно интересуются контентом этого человека, они всё это дело распространят, и бренд получит свою вовлечённость.

Второй вариант, как использовать подобную технологию сейчас, достаточно актуальный — это поиск ботов, моё любимое. Это и репутационный риск для ваших конкурентов, и возможность отсеять от рекламной кампании нерелевантных людей, и всё, что угодно (и удаление комментариев, и поиск связей между людьми). У меня есть такой пример, он тоже есть большой интерактивный — его можно подвигать. Это связи людей, которые писали комментарии в сообществе «Лентач».

Такой пример — для того, чтобы вы понимали, насколько хорошо и просто видно ботов; и для этого не нужно обладать каким-то техническими знаниями. Значит, «Лентач» выпустил пост о расследовании ФБК про Дмитрия Медведева, и определённые люди стали писать комментарии. Мы собрали всех людей, которые писали комментарии — эти люди зелёные. Сейчас подвину:

Люди — это зелёные (которые писали комментарии). Они есть здесь, они есть здесь. Голубые точки между ними — это их общие группы, жёлтые — общие подписчики, друзья и так далее. Вот основная масса людей связана между собой. Потому что, какая бы ни была теория трёх, четырёх, пяти рукопожатий, все люди связаны между собой в социальных сетях. Нет людей, которые отделены друг от друга. Даже мои друзья-социофобы, которые используют «Вконтакте» исключительно для просмотра видео, всё равно на какие-то одинаковые с нами паблики подписаны.

Навальный тоже использует ботов. Боты есть у всех

Основная масса людей (вот она, здесь) связаны между собой. Но есть такая маленькая группка товарищей, которая находится в друзьях исключительно друг у друга. Вот они, зелёненькие, вот их общие друзья и группы. Они даже отдельно здесь отвалились:

И по счастливой случайности именно эти люди именно под этим постом писали: «У Навального нет доказательств» и так далее, писали одинаковые комментарии. Выводы делать я, конечно, не берусь. Но тем не менее, у меня был другой пост в «Фейсбуке», когда были дебаты Лебедева и Навального, я точно так же анализировал комментарии: там получилось, что все люди, которые написали «Лебедев — говно», они не заходили в соцсети последние четыре месяца, не подписаны ни на один из пабликов, внезапно зашли именно в этот пост, написали именно этот комментарий и ушли. Выводы, опять, отсюда делать нельзя, но кто-то из команды Навального мне написал коммент, что ботов они не используют. Ну и ладно!

Ближе к рекламе, ближе к бренду. Боты сейчас есть у всех! Они есть и у нас, есть и у конкурентов, ещё у кого-то. Их надо выкидывать либо оставлять, чтобы они хорошо жили; на основании таких данных (указывает на предыдущий слайд) доводить их до совершенства, чтобы они выглядели как реальные люди и только тогда ими пользоваться. Хотя пользоваться ботами плохо! Тем не менее достаточно частая история…

В автоматическом режиме такая вещь позволяет отфильтровать из своего анализа людей нерелевантных для анализа, людей, которые не должны попасть в выборку, не должны попасть в это исследование. Очень часто используется. Опять же, не все владельцы автомобилей действительно являются владельцами автомобилей. Иногда интересны только люди, у которых есть потенциально автомобиль, которые сидят в каких-то группах, с кем-то общаются, у них там есть определённая аудитория.

Анализ фактов и мнений

Следующее, что у меня есть, тоже моё любимое. Это анализ фактов и мнений.

Упоминание о своём бренде в различных источниках сейчас умеют делать все. В этом нет никакого секрета. И тональность вроде все умеют считать… Хотя лично я считаю, что сама по себе метрика тональности не очень интересная, потому что, когда ты приходишь и говоришь клиенту, — «Мужик, у тебя 37% нейтрала, — и он такой говорит, — «Ничего себе! Круто!» Поэтому интереснее было бы двинуться чуть дальше: от оценки тональности до оценки мнений того, что о вашем продукте говорят.

И это тоже очень интересная вещь, потому что… Я лично считаю, что нейтральных сообщений в принципе быть не может, потому что, если человек что-то пишет в публичном пространстве, это сообщение по-любому как-то окрашено. Вот я лично никогда не видел нейтрального сообщения с упоминанием какого-то бренда. Обычно это какая-то грязь.

Если возьмём большое количество этих сообщений (их может быть миллионов, 10 миллионов), выделим из каждого сообщения главную мысль, объединим их, мы можем понять достаточно достоверно, что люди говорят об этом бренде, что они считают. «Мне не нравится упаковка», «Мне не нравится консистенция» и так далее.

Что думают о «Трансаэро», чупа-чупсе и президенте США

Смешной пример у меня есть такой: это инфографика о том, что бы сделали пользователи социальных сетей с компанией «Трансаэро» после её банкротства.

Там есть много интересных примеров: сжечь, убить, выслать в Европу, были даже 2%, которые написали — «Отправить их в Сирию на военные действия». Двигаясь от смешной штуки, это может быть любой бренд практически — начиная от моих любимых собачьих кормов, заканчивая какими-нибудь автомобилями. Кому не нравится упаковка, кому не нравятся реальные вещи — с этим всегда можно работать, с этим всегда можно считаться. Есть большое количество примеров, когда люди чуть ли не производство своей продукции меняли, потому что в соцсетях писали, что чупа-чупс недостаточно круглый или он недостаточно сладкий.

Есть ещё такой смешной пример. Догадайтесь, какие комментарии и про кого?

Почему-то сейчас именно анализ мнений, анализ фактов, выделяемых из сообщений, не очень используется, не очень ши