HFLabs закончила тестирование «Маскировщика» — решения для обезличивания персональных данных

49926b31a68f63f9407878fd8e2b7783

Российская IT-компания HFLabs закончила тестирование и выпустила «Маскировщик» — решение для умного маскирования (обезличивания) персональных данных, рассказали Хабру в пресс-службе компании. Цель продукта — снизить риск утечки во время тестирования IT-систем при сохранении качества тестов. Новый продукт HFLabs доступен как коробочное решение и как SaaS-сервис.Он обезличивает разные типы данных: ФИО, даты рождения,  адреса, телефоны, e-mail, ИНН, СНИЛС, банковские карты и счета, ПТС и водительские удостоверения. Другие типы данных можно маскировать, выбрав из преднастроенных правил несложные мутации.

Получить доступ к решению можно через DaData или сайт HFLabs.

«Маскировщик» при обезличивании сохраняет качество и контекст данных и делает их максимально похожими на настоящие. При маскировании не теряются социально-демографические характеристики, географическое распределение, родственные связи и даже форматно-логический контроль документов, благодаря чему обезличенные данные могут использоваться для корректного построения аналитических моделей.

Например, «Маскировщик» заменяет ФИО с учётом его популярности и пола клиента. Номера телефонов при умном маскировании не теряют привязку к оператору или региону, адреса остаются валидными в пределах региона или города, а люди, проживающие по одному и тому же адресу, получают другой реальный адрес. Для сохранения социально-демографических признаков даты рождения меняются в пределах небольшого интервала (например, 1991 год на 1992). Отдельные возрастные рамки, значимые для маркетинга, могут быть заданы жёстко: например, человек младше 18 лет не станет совершеннолетним. Также «Маскировщик» сохраняет особенности документов: валидность паспортов, ИНН, СНИЛС. Он учитывает их формат, контрольные суммы и действительность. 

«Маскировщик» обезличивает данные для всех тестовых стендов компании, используя единый алгоритм в рамках итерации маскирования. Замены подбираются случайным образом, сохраняются в зашифрованном виде и удаляются по окончании процесса обезличивания всех стендов, что позволяет соблюсти консистентность между всеми маскируемыми базами и исключить возможность обратного восстановления исходных значений.

Впервые «Маскировщик» был опробован в крупном банке, где нужно было замаскировать данные клиентов из определённого сегмента. Миллион записей был обработан за 3 минуты, а база клиентов в результате обезличивания сохранила консистентность и семантические особенности, указали в HFLabs. 

© Habrahabr.ru