Налоговая инспекция США использует дата-майнинг и предсказательную аналитику

1b375b255590425288bb90cfe47b5702.jpgВ России и странах СНГ налоговые преступления не считаются чем-то экстраординарным для физического лица. Недоплатил налог? Ну ладно, доплати сколько надо — и свободен. Совершенно иная ситуация в США. Там за сокрытие налогов можно надолго сесть в тюрьму, это одно из самых серьёзных преступлений перед государством, наряду с государственной изменой и шпионажем в пользу другого государства. Так что с IRS (так называется местная налоговая инспекция) лучше не шутить.

А вот сама IRS становится всё более умной. Она начинает применять современные технологии, чтобы выявить тех граждан, у которых расходы не соответствуют официально полученным доходам. Об этом пишет издание Vanderbilt Journal of Entertainment and Technology Law со ссылкой на отчёт адъюнкт-профессора бизнес-права Университета штата Вашингтон Кимберли Хаусер (Kimberly A. Houser) и профессора бухгалтерского учёта Университета штата Вашингтон Дебры Сандерс (Debra Sanders).

Как сообщается, IRS теперь занимается дата-майнингом публичных и коммерческих наборов данных (в том числе из социальных сетей), чтобы создать подробные профили налогоплательщиков, с помощью которых специалисты налоговой осуществляют анализ данных.
Авторы отчёта говорят, что методы работы налоговой инспекции остаются в основном неизвестными широкой публике. В то же время возникают сомнения в их законности. По мнению некоторых юристов, сбор данных из социальных сетей и профилирование пользователей с дата-майнингом их доходов сама может нарушать законодательство. Хотя пользователи сами выкладывают информацию на всеобщее обозрение, но налоговая инспекция начинает собирать на них профиль до начала аудита. Существование дата-брокеров (компании, которые собирают информацию на пользователей и перепродают её заинтересованным лицам) и возможность купить через интернет информацию практически о любом человеке создают ситуацию, когда человек теряет контроль над своими персональными данными. Это особенно опасно, если заинтересованным лицом выступает государство в лице налоговой службы.

Отсутствие прозрачности и подотчётности в этом процессе вызывает ещё более серьёзные вопросы. Скрытные действия государства по такому сбору государству незаконны, и к тому же могут привести к дискриминации.

Авторы отчёта перечисляют все методы сбора, которые использует IRS, а также статьи законов, которые может нарушать налоговая инспекция в процессе сбора и дата-майнинга данных.

Итак, источники информации налоговиков:

  • Формы W-2 от работодателя (стандартная практика).
  • Записи телефонных разговоров. По сведениям Американского союза защиты гражданских свобод, IRS была в числе заказчиков оборудования для прослушки сотовых телефонов (так называемые устройства Stingray) в 2009–2012 годах.
  • Электронная почта. Запросы по Закону о свободе информации в 2013 году показали, что налоговая служба просматривала личную почту налогоплательщиков без ордера.
  • Социальные сети. По запросу в соответствии с Законом о свободе информации IRS подтвердила, что собирает информацию с сайтов социальных сетей. В учебном пособии IRS семилетней давности перечислены Facebook, MySpace и YouTube как источники информации о налогоплательщиках.
  • Дата-майнинг предполагает анализ больших наборов данных, которые собирались с целью, отличной от той, с которой их анализируют. Цель — выявить ранее неизвестные взаимосвязи в данных. Об использовании дата-майнинга сообщается во внутренних документах IRS. Независимые источники говорят, что налоговая служба таким образом уточняет профили налогоплательщиков.


При этом возможны следующие потенциальные нарушения законодательства:

  • A. Нарушение практик добросовестного обращения с информацией.
    1. Отсутствие уведомления.
    2. Секретная система сбора данных (нарушение Закона об охране прав личности 1974 года (Privacy Act of 1974)).
    3. Отсутствие согласия налогоплательщика на контакт IRS с третьей стороной (нарушение раздела 7602 Кодекса внутренних доходов (Internal Revenue Code)).
    4. Потеря контроля пользователем над использованием персональной информации.
  • B. Отсутствие прозрачности в алгоритме.
    1. Нарушение Закона об административном производстве (Administrative Procedure Act).
    2. Ошибки дата-майнинга: неточные профили налогоплательщиков.
    3. Потенциальная дискриминация. После самообучения алгоритмы предсказания начнут с предубеждением ставится к людям, учитывая цвет кожи, место жительства и другие дискриминационные признаки.
    4. Произвольные и причудливые действия агентства. По всем вышеупомянутым причинам, использование дата-майнинга и алгоритмов самообучения может привести к тому, что автоматизированная государственная система принятия решений станет принимать непонятные человеческому разуму решения.
  • С. Сбор данных.
    1. Нарушение Закона 1986 г. о конфиденциальности электронной связи (Electronic Communications Privacy Act) — здесь очевидные нарушения в связи с прослушкой телефонов и несанкционированным чтением электронной почты.
    2. Обыски без ордеров (просмотр почты на сервере, которая хранилась дольше 180 дней).
    3. Ненадлежащая правовая процедура.
    4. Самооговор — люди фактически дают невыгодные для себя показания, обличают сами себя, а вынуждение к таким показаниям запрещено Пятой поправкой к Конституции.
  • D. Другие федеральные нарушения.
    1. Нарушение Закона об охране прав личности 1974 года.
    2. Нарушение Закона 1988 года о компьютерном сопоставлении данных и защите права на личную жизнь (Computer Matching and Privacy Protection Act 1988).
    3. Нарушение раздела 6013 Кодекса внутренних доходов, где говорится, что информация, имеющая отношение к налогам, должна оставаться конфиденциальной и не раскрываться никоим образом. Речь идёт о соответствующих правилах хранения и защиты этой информации у IRS, предусмотрены наказания для сотрудников IRS за нарушения правил.
    4. Закон о качестве данных (Data Quality Act) требует от федеральных агентств предпринимать действия для проверки качества собираемых данных.


В целом, действия американской IRS уже могут нарушать ряд федеральных законов. Вполне возможно, что в ближайшие годы их продвинутые методы дата-майнинга переймут российские коллеги, тем более в бюджете сейчас большой дефицит — и государству крайне необходимо увеличить налоговые сборы с граждан.

Тогда лучше дважды подумать, прежде чем публиковать в «контактике» фотографии с отпуска на Кайманах или снимок нового автомобиля, который вы купили, затащив онлайновый турнирчик по покеру. Думали, что налоговая об этом не узнает? Теперь узнает.

© Geektimes