[Перевод] Kindle собирает подозрительно много информации

pqyqfxjrw6twjqru3z9snp3m_wy.jpeg

Я люблю читать и у меня есть несколько моделей Kindle, от самого первого до Paperwhite, они мне все нравятся.

Однако, ввиду своей профессии, я привык следить за потенциальными угрозами. Технически, Амазон владеет контентом который вы просматриваете. Они даже могут отобрать его в любой момент. Было не мало случаев, когда Амазон удалял книгу с устройства пользователя. Случалось, что Амазон блокировал аккаунт и доступ ко всем купленным книгам.

Традиционные книги с трудом конкурируют с функционалом, который может предоставить Kindle. Закладки, заметки, синхронизация между устройствами, последняя прочитанная страница и так далее. Kindle так же показывает рекламу, какую книгу вам прочитать следующей.

Мне стало интересно, отправляет ли Kindle только самую необходимую информацию для поддержки этого функционала или может быть он шлет какую-то более персонализированную информацию обо мне?

Как оказалось, Kindle собирает много информации


Kindle отправляет информацию о девайсе, метадату, детали каждого взаимодействия с устройством или приложением в процессе использования. Вся информация привязана к аккаунту читателя.

Моя книжка отправила 100 запросов к Амазоновским серверам, а я лишь открыл книжку и перелистнул пару страниц:

4jluhv57lijzxm8r7ukgbnd2ot4.png
(откройте в новой вкладке для большего размера)

Необоснованное количество информации


Kindle собирает информацию буквально обо всем в плоть до каждого тапа (клика) пользователя.

Каждый раз когда вы открываете страницу на сервер отправляется такая информация:

  • Время открытия страницы (каждый раз когда вы открываете новую страницу генерируется timestamp)
  • Первый символ на странице (индекс, например 7705 в книге)
  • Последний символ на странице
  • Является ли страница текстом или картинкой


Пример отправляемых данных при открытии страницы:

{
    "created_timestamp": 1597743233808,
    "payload": {
        "context": "Reading",
        "continuous_scroll_state": "disabled",
        "end_position": 4708,
        "is_scrolled_over_span": false,
        "span_type": "Text",
        "start_position": 4193
    },
    "schema_name": "kindle_positions_consumed_v2",
    "schema_version": 0,
    "sent_timestamp": 1597743233855,
    "sequence_number": 26
}


Каждая сессия так же записывается. Kindle отправляет информацию о том, сколько страницы вы прочитали, в какой ориентации (горизонтально или вертикально):

{
    "created_timestamp": 1597743255324,
    "payload": {
        "action_type": "PageTurn",
        "book_length": 2003478,
        "context": "Reading",
        "count": 10,
        "navigation_end_location": 7884,
        "navigation_mode": "Horizontal",
        "navigation_start_location": 3599
    },
    "schema_name": "reader_in_book_navigation_v2",
    "schema_version": 0,
    "sent_timestamp": 1597743265854,
    "sequence_number": 36
}


Похожая информация отправляется, когда происходит открытия приложения, находится ли оно в фоновом режиме, когда было открыто, когда закрыто. Так же отправляется время смены шрифта, его размера. Каждое слово которое вы выделяете отправляется на сервера перевода Bing или Wikipedia, а затем к Амазону.

Эта информация вряд ли используется для определения на какой странице вы остановились.

Большинство информации не отправляется сразу. А собирается в своего рода буфер. Даже если вы читаете в офлайне, вся информация отправляется кусками, как только вы подключитесь к интернету.

Информация об устройстве


Kindle отправляет информацию об устройстве, включая ту которую я бы не хотел светить.

  • Страна проживания
  • Попытки подключения к сети (10 адресов)
  • Информация девайса — версия, размеры, модель (читать можно на iphone, android, Kindle и тд).
  • Информацию об аккаунте Good Reads
  • Ориентацию устройства


Вероятно эти данные помогают Амазону лучше понимать пользователей, но информация об IP адресах явно лишняя. Я не нашел информацию о какой-либо геолокации, но это было бы просто замечательно.

Выводы


Kindle далек от того, что бы обвинять его в сборе персональных данных. Тем не менее он собирает много лишней поведенческой информации. В течение года я пытался избавиться от экосистемы Kindle и перешел на Marvin читая с iPhone. Я больше не использую Kindle, но скучаю за e-Ink.

К сожалению, достаточно трудно найти DRM-free книги.

© Habrahabr.ru