Google открыл систему для анализа наборов данных без нарушения конфеденциальности
Компания Google представила криптографический протокол конфиденциального многостороннего вычисления Private Join and Compute, позволяющий проводить анализ и вычисления над зашифрованными наборами данных от нескольких участников, сохраняя конфиденциальность данных каждого участника (каждый участник не имеется возможности получить информацию о данных других участников, но может производить над ними обобщённые вычисления без расшифровки). Код реализации протокола открыт под лицензией Apache 2.0.
Private Join and Compute позволяет передать приватный набор записей третьему лицу, которое сможет выполнить его анализ и в обобщённом виде оценить различия со своим набором, но не имеет возможность узнать значения конкретных записей. Например, имеется возможность в зашифрованном наборе данных получить такие сведения, как число совпадающих со своим набором идентификаторов и суммы значений записей с совпадающими идентификаторами. При этом невозможно узнать какие именно значения и идентификаторы присутствуют в наборе.
Протокол Private Join and Compute, также именуемый как Private Intersection-Sum, основан на комбинации протокола случайной забывчивой передачи (Random Oblivious Transfer), шифрованных фильтров Блума и двойной маскировке Полига — Хеллмана.
Предложенная система может оказаться полезной, например, когда одно медицинское учреждение имеет сведения о состоянии здоровья пациентов, а другое о назначении нового профилактического лекарства. Протокол «Private Join and Compute» позволяет не раскрывая информации, объединить зашифрованные наборы данных и вывести общую статистику, которая позволит понять снижает ли назначенный препарат заболеваемость или нет. Ещё один пример, кода на основе базы аварий от госавтоинспекции и базы применения усовершенствованных средств безопасности в автомобилях можно оценить влияет ли появление этих средств на число аварий.
Другой пример, когда на основе базы сотрудников одной компании и данных о покупках от другой, можно вычислить сколько сотрудников из первой компании осуществили покупки во второй и на какую сумму. В контексте рекламных сетей можно производить подобные вычисления для оценки эффективности рекламных компаний, оперируя списками пользователей которым была показана реклама и которые сделали покупки в интернет-магазине.
© OpenNet