Mozilla: пользователя можно идентифицировать по посещению предпочитаемых сайтов с точностью в 99%
Сотрудники компании Mozilla изучили возможность идентификации пользователей на основании журнала посещений различных сайтов. Журнал могут видеть посторонние лица или же разные сервисы и сайты. В ходе исследования представители Mozilla изучили профили примерно 52 000 пользователей браузера Firefox, которые согласились принять участие в проекте, установив расширение OpenWPM для Firefox.
Данные собирались с 16 июля по 13 августа 2019 года. Разработчикам удалось получить информацию о более чем 35 миллионах посещенных страниц и 660 тысяч доменов. В среднем каждый участник исследования просматривал за день 8 доменов.
Исследование состояло из двух этапов. В ходе первого сотрудники Mozilla собирали статистику посещения доменов, а в ходе второго — пытались идентифицировать пользователей по полученным ранее данным. Временной интервал между двумя этапами — 7 дней. На втором этапе при выборке в 50 и более посещенных сайтов удалось идентифицировать 50% пользователей. Когда выборку увеличили до 150 и более доменов, удалось идентифицировать 80% пользователей.
Как оказалось, уникальность полученных профилей истории посещений сайтов составляет 99%.
Авторы проекта дополнительно изучили 10 000 сайтов на предмет наличия инструментов для идентификации пользователей. На 9 823 сайтах были обнаружены средства идентификации пользователей от Google, на 7 348 — от Facebook, на 5 500 — от Verizon. Эти инструменты дают возможность владельцам популярных ресурсов идентифицировать пользователей с высокой вероятностью.
Исследователи отметили, что сейчас появились новые способы идентификации пользователей. Например, оценка кэширования настроек HSTS и анализ состояния CSS-свойства «visited». Также в ряде случаев при помощи перебора в коде на JavaScript популярных доменов по оценке времени доступа к ресурсам можно было узнать, посещал ли пользователь искомый сайт. Тем не менее, самым популярным средством идентификации посетителей до сих пор остаются куки.
В Mozilla отмечают, что большинство пользователей не знают об инструментах защиты от идентификации со стороны владельцев сайтов или иных лиц. Например, у Edge и Firefox есть встроенная защита на основе черных списков средств идентификации разных разработчиков. Браузер Tor периодически меняет «цифровые» отпечатки пользователей. Правда, эти способы в некоторых случаях приводят к проблемам с отображением сайтов. Mozilla предлагает активнее информировать пользователей о способах защиты персональных данных и широко использовать программные инструменты для обеспечения конфиденциальности.