Хабра-детектив на выходных

tueioriwetoorzxmhouspgkz7oc.png
Вы ведь знаете, что такое дежавю? То самое «это уже где-то было», только не про последний вышедший в кинотеатре фильм, а про то, что происходит именно с вами.

К примеру, не казалось ли вам, что вы уже видели какую-либо статью на Хабре раньше? В большинстве случаев, в этом нет ничего плохого. Технические статьи зачастую содержат уже опубликованную ранее информацию — они доработаны, перепроверены и просто улучшены. Ну, а новости — с ними надо просто смириться.

Итак, давайте посмотрим, действительно ли это уже было, проведя небольшое расследование.


Начало

Моё дежавю началось с этого изображения. Стоит отметить, что я не читаю большинство постов, а лишь просматриваю заголовки и картинки до тега < cut/ > и листаю дальше. Потому безобидный JPG и бросился в глаза — он уже где-то был недавно.


441e87b1738dcc5ba6ce21e2ef5d7871.jpg

Рис. 1. КДПВ из «Языковые слои» (2019–11–20)

К тому же, я уже точно видел переводы постов Robert C. Martin совсем недавно. Найти их было не сложно — все три. КДПВ «Три парадигмы» (2019–11–12) — то же самое изображение на hsto.org.

«Ну и что?» — спросит каждый, кто дочитал до этой фразы. Конечно, авторы постов на одну тематику часто используют похожие изображения для привлечения внимания, а заодно экономят место на hsto.org. Для начала скажу, что авторы упомянутых постов разные (Harhencko и Simple219 соответственно). А вот качество перевода у них похоже, точнее «Перевод немного странный».

Но вернёмся к третьему посту-переводу, о котором я уже упомянул — «Слишком чисто?» (2019–11–16).

Да, КДПВ формально другая — она успокоила мою паранойю, и я принялся читать перевод. Не будем останавливаться на качестве перевода, лишь замечу, что после прочтения я увидел логин автора и паранойя вернулась. Пост написан yanaharchencko. И это не тот пользователь, что Harhencko.

Что ж, теперь я просто не мог остановиться. Я должен был узнать, сколько на Хабре опубликовано таких же переводов.


Расследование

Первый шаг в нашем псевдо-детективном расследовании — найти общее. На Хабре публикуется много всего и необходимо было сузить круг подозреваемых. Всё начинается с «Привет, Хабр! Предлагаю вашему вниманию перевод статьи» — стандартного начала. Наверняка, оно подставляется НЛО, которое выпускает посты из Песочницы. Стоп, песочница — именно оттуда все три поста. На самом деле, лишь два из трёх, однако это я заметил позже и моя начальная оплошность никак не повлияла на расследование. И все они — переводы. Для начала нам этого хватит.

Всего на момент первого поиска (2019–11–20) я нашел 37 подобных постов до 2019–07–15 включительно. 14 из них были опубликованы в ноябре. Возможно, я пропустил некоторые из таких же за этот период — поиск производился вручную, ведь как настоящий детектив я не доверяю никому, даже компьютеру. Стоит отметить, что на момент написания этой части текста (2019–11–23), добавилось ещё 5 постов-переводов из песочницы. При этом один из них был отправлен в дальний космос минусов и скрыт автором.

Итак, у нас есть 41 + 1 пост — что нам известно про них и их авторов. У 10 авторов больше, чем 1 пост, максимум — 7 штук от одного. Будем считать, что эти пользователи действительно активные участники Хабра-сообщества. 12 из оставшихся 32 зарегистрированы на сайте до 2019 года, а некоторые из них ещё в 2012. Ещё два пользователя были зарегистрированы за 119 и 109 дней до того, как опубликовали свои первые посты.

После такой грубой фильтрации осталось 18 зарегистрированных. Давайте посмотрим статистику их переводов. Рейтинги варьируются от -19 за «Эти 10 каналов с прямыми трансляциями сделают вас лучше в программировании» (и он же получил больше всего минусов — 24) до +33 за уже упомянутый Слишком чисто? (с максимумом в 46 плюсов). Пост 10 лучших практик для проектирования баз данных был скрыт до сбора статистики от 2019–11–23 (но я видел там много минусов, хотя верить мне не обязательно).

Статистика авторов немного другая — больше всего голосов за карму получил пользователь yanaharchencko — 21 (что не помогло сумарной карме в 6.2), а самый низкий кармо-рейтинг у evelina_n — 0 кармы с 12 голосов. Лишь один из пользователей комментировал разные посты на Хабре и потому его мы тоже исключим из рассмотрения. Пятеро комментировали свои посты и ещё 12 не написали ни одного комментария.

Но что-то же должно быть общего между этими пользователями? Найти ответ оказалось не сложно. Достаточно было просто зайти во вкладку подписан на / подписчики. И тут меня ожидал ответ для моей паранойи — между ними есть что-то общее. Они все подписаны друг на друга. Ну как все, 11 аккаунтов. Давайте присмотримся повнимательнее.


zvb6tjmufgfm87ixashy0bub6ea.png

Рис. 2. Взаимная подписка рассматриваемых аккаунтов с 2019–11–20 до 2019–11–23


То же самое GIF анимацией (186 KB)
c3j3xjcpgbyzbu7tpkbwpajfc18.gif

Рис. S2. Взаимная подписка рассматриваемых аккаунтов с 2019–11–20 до 2019–11–23

Не подозрительно ли? Особенно если учесть, что подписок на другие аккаунты у них практически нет. Внимательный читатель может заметить, что кроме 11 пользователей, о которых я говорил ранее (и которые перечислены под следующим спойлером), в данных присутствует двенадцатый — Ramir23 — единственный кто написал оригинальный пост Создание простой кликер-игры с нуля. Что он здесь делает — отдельный вопрос.


Список подписантов

Табл. S1. Список подозрительных аккаунтов, сортированый по дате получения приглашения на Хабр

*Для пользователя Emil-8 представлены данные состоянием на 2019–11–23 и -24 в связи с публикацией нового поста.

Все аккаунты зарегистрированы начиная с 2019–09–20, а захабрены с 2019–10–04. Между регистрацией и публикацией проходило от 1 до 14 дней за исключением
borisname (49 дней).

Пока я собирался с мыслями и делал красивую схему подписок, аккаунт Emil-8 опубликовал новый перевод Как сделать ваш HTML отзывчивым, добавив одну строку кода на CSS от 2019–11–23 на абсолютно другую тему и уже не из песочницы. Ранее перевод другой версии этого же текста оригинального автора уже публиковался на Хабре Делаем адаптивный HTML, добавляя одну строку в CSS 2017–12–16.


Чем занимаются неподозрительные аккаунты?

Итак, оригиналы взяты с:

Из оригиналов 11 на английском, 1 — на немецком. 3 статьи написаны одним автором и ещё 2 другим, остальные — разными.

Поговорим о тематике, а в случае Хабра — о хабах. Итак, из 11 доступных для прочтения переводов в следующих хабах представлены:


  • 6x Programming;
  • 2x Perfect code, Web design, CSS, HTML и IT career;
  • 1x Functional Programming, History of IT, Learning languages, Reading room, IT Standards, Development for iOS, Electronics for beginners, Website development, Design, High performance, Java, Interfaces, Language localisation, Internet marketing и Content-marketing;

Пользователи Хабра указали на неточности или ошибки перевода в 7 постах из 10 прокомментированых.

Кроме публикации по одному переводу с каждого из 11 аккаунтов, рассмотренные пользователи также добавляют посты друг друга в избранное — 24 раза (максимум 5 избранных на аккаунт).

Из 12 аккаунтов 5 подписаны на 26 разных компаний, представленных на Хабре — всего 45 подписок, 2 компании встречаются все 5 раз и ещё 3 по 3 раза.


Ещё кто-то?

До данного момента были упомянуты только аккаунты, которые встречались в подписках значительное количество раз. Есть ли там другие? Есть, трое. Двое read-only (регистрация 2019–11–09 и -22) и один полноценный (регистрация 2019–11–07, приглашение от НЛО 2019–11–17). Последний, вероятно, вышел из песочницы и скрыл пост позже, потому информации о посте на данный момент нет.


pvci2hztvcyrn1bnbwm6mtu7nhc.png

Рис. 3. Подписка рассматриваемых аккаунтов состоянием на 2019–11–24, дополненная аккаунтами со схожим поведением

Интересное наблюдение, Alsou17 сразу после регистрации добавил в подписки bar_nat и больше активности не проявлял (по состоянию на 2019–11–24). Подписки ays_aad и Mercerexy не менялись с момента начала наблюдения (последняя активность 2019–11–20 и -18 соответственно).

Часто ли можно увидеть подписки на свежезарегистрированный read-only аккаунт? Пожалуй, оставлю этот вопрос без ответа.


Вместо заключения

«Что ж делать с этой информацией?» спросите вы, дочитав до конца? Вопрос, несомненно, интересный.

С одной стороны, это лишь 11 аккаунтов (и ещё 3 не менее подозрительных), вклад которых в Хабр — «переводы by Google Translate». 6 из них получили карму выше 5 и могут повлиять на рейтинг чужих постов и карму аккаунтов.

С другой стороны, 6 из аккаунтов появились за последние несколько дней и будет ли продолжаться такое распространение взаимосвязанных «пользователей» не известно.

Но всё же, зачем они это делают?…

На этой неопределённой ноте в духе любого стандартного детективного фильма прямиком из кино я и закончу. Спасибо за внимание!

«Если вы параноик, это ещё не значит, что за вами не следят» Гарольд Финч

P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав »Ctrl + Enter», если у вас есть Ctrl, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!

© Habrahabr.ru