Накручивание звёзд вредоносным репозиториям на GitHub
Исследователи из Университета Карнеги-Меллона, Университета штата Северная Каролина и компании Socket разработали инструментарий для определения проектов с накрученным рейтингом на GitHub. В результате применения инструмента было выявлено 3.1 млн фиктивно выставленных звёзд, охватывающих 15835 репозиториев. Для накрутки были задействованы 278 тысяч учётных записей.
Процесс добавления фиктивных звёзд был поставлен на поток и в основном применялся для повышения уровня доверия к репозиториям, распространяющим вредоносный код под видом пиратских копий коммерческих программ, криптовалютных ботов и игровых читов. Накручивание звёзд также использовалось для продвижения продуктов, самоутверждения разработчиков, принижения конкурентов и повышения значимости в глазах пользователей. Приводятся примеры 7 коммерческих сервисов накрутки, стоимость работы которых составляет от $0.10 до $1.62 за звезду.
В ходе исследования было обработано 6 миллиардов событий, отражённых в 20-терабайтном архиве активности GitHub, отслеживаемой проектом GHArchive. События были проанализированы на наличие аномалий, таких как синхронное выставление звёзд группам проектов, всплески повышения рейтинга неактивных проектов и перекос активности пользователей, созданных для накрутки. Инструментарий StarScout, использующий кластерный анализ и выявление типичных для накруток повторяющихся шаблонов поведения, опубликован под лицензией Apache 2.0.
В результате применения инструмента выявлены аномалии при появлении на GitHub 4.53 млн звёзд, выставленных с использованием 1.32 млн учётных записей и охватывающих 22915 репозиториев. Для исключения ложных срабатываний была проведена дополнительная фильтрация результатов, в ходе которой были оставлены только выраженные всплески выставления звёзд и репозитории с высоким процентом подозрительных звёзд.
В итоге выделено 278 тысяч учётных записей с типичными для накруток повторяющимся шаблоном поведения. Данные учётные записи были использованы для выставления 3.1 млн звёзд 15835 репозиториям. 90.75% из отмеченных репозиториев и 61.95% учётных записей были удалены GitHub по состоянию на октябрь 2024 года.
Источник: http://www.opennet.ru/opennews/art.shtml? num=62515
© OpenNet