Поисковая система в АНБ содержит более 850 млрд записей
В рамках проекта The Intercept опубликована очередная порция документов, переданных Эдвардом Сноуденом в СМИ. Эти документы описывают поисковую систему ICReach, работающую в АНБ.
Поисковая система, как сказано в презентации, снабжена простым интерфейсом, похожим на Google. Она осуществляет полнотекстовый поиск по более 850 млрд записям с конфиденциальной информацией: это метаданные телефонных разговоров (вызываемые номера, время и место звонка), электронной почты (имена отправителя и получателя, время отправки) и интернет-чатов, факсов, координаты сотовых телефонов и др. (всего 30 видов данных).Хотя система не индексировала непосредственно тексты сообщений, а только метаданные, но это тоже очень ценная информация для разведки. Например, можно быстро составить список всех людей, которые звонили на определённый телефонный номер в течение года. Или составить список всех людей, кто был на определённой улице или площади с 20:00 по 21:00 и имел при себе мобильный телефон.
Ранее опубликованные документы от Сноудена рассказывали о множестве программ по массовому сбору информации, которые работают в АНБ. Теперь проясняется картина, каким образом обрабатывается эта информация и как другие агентства получают к ней доступ.
В служебной записке от 2010 года сказано, что интерфейс ICReach доступен для более чем 1000 аналитиков из 23 федеральных агентств.
В другой служебной записке от 2007 года сообщается, что систему ICReach начали разрабатывать в 2005 году и она значительно расширила возможности АНБ по обработке и анализу данных.
«Разработчики ICReach впервые обеспечили разведывательному сообществу США доступ к коммуникационным метаданным, — сказано в документе. — Разработка началась более двух лет назад с базовой концепции, призванной удовлетворить растущий спрос разведывательного сообщества на такие метаданные и [появившиеся] возможности АНБ по сбору, обработке и хранению больших объёмов коммуникационных метаданных, связанных с целями разведки по всему миру». Новый поисковик разработан на смену технологически устаревшим системам CRISSCROSS и PROTON, которые запустили в ЦРУ в 90-е гг.
Поисковая система разработана с расчётом на добавление до 5 миллиардов записей ежедневно (на практике индекс пополнялся на 1–2 млрд записей в сутки). Судя по всему, поисковая система индексировала содержимое нескольких баз данных, которые пополнялись независимо друг от друга в рамках различных программ перехвата коммуникаций, действующих в АНБ.
Пилотную версию ICReach запустили в 2007 году и она в 12 раз увеличила объём метаданных, которыми спецслужбы делились между собой.
Изначально предполагалось, что обслуживание поисковой системы обойдётся в сумму от $2,5 млн до $4,5 млн в год. Но в 2010 году планировалось сделать апгрейд системы, чтобы расширить базу более чем на 850 млрд записей, так что сумма могла увеличиться.