«Обошли Тьюринга»: новый подход к распознаванию капчи

Разработчики из компании Vicarious, в число инвесторов которой входят Марк Цукерберг и Джефф Безос, опубликовали статью, где описали новую модель глубокого обучения, способную распознавать текстовые капчи. Новая порождающая вероятностная модель (Probabilistic Generative Model) позволила, как уверяют ученые, на шаг приблизиться к созданию «думающих» интеллектуальных систем.

Каких успехов достигла технология и какие еще решения появились в этой области, расскажем далее.

lljpa9e4ljfupbarvwmbpj2v_ia.jpeg
/ фото Rick B PD

Система использует техники, воспроизводящие функции зрительной коры головного мозга. Речь идет о модели компьютерного зрения, которую разработчики назвали «рекурсивной кортикальной сетью» (RCN — Recursive Cortical Network).

В RCN объекты представляются в виде сочетания контуров и поверхностей. Контуры представляют собой границы поверхностей, а последние моделируются с помощью условного случайного поля (Conditional Random Field). Эти компоненты позволяют модели распознавать символы без тщательного перебора всех возможных сочетаний.

Капча считается взломанной, если система решает её с точностью не менее 1%. Рекурсивная кортикальная сеть взломала reCAPTCHA с точностью 66,6%, а капчи Yahoo и PayPal с точностью 57,4% и 57,1% соответственно.

Решения других ученых тоже могли обойти reCAPTCHA, но при этом они требовали обучения на крупных размеченных сводах данных или ручной настройки для распознавания тех или иных изображений. Система от Vicarious имеет сопоставимую с этими методами точность, но при этом требует в триста раз меньше данных. Также разработчики не использовали для обучения сети изображения с большим количеством шумов и искажений — кортикальная сеть сама обобщила такие CAPTCHA.

Что дальше


Цель проекта компании Vicarious — создать искусственный интеллект, который смог бы решать обычные для человека проблемы и задачи. Поэтому в планах ученых стоит совершенствование кортикальной сети. Глобальная цель разработчиков — создать полномасштабный искусственный интеллект, который будет функционировать как человеческий мозг.

Но пока новая система лишь хорошо распознает текстовые капчи. А многие сайты предлагают более сложные «автоматизированные тесты Тьюринга», задачи на логику и даже мини-игры, в которых пользователю предлагают вращать картинки.

Однако уже сейчас появляются решения, которые могут взламывать такие «продвинутые» капчи. Например, исследователи из Мэрилендского университета создали систему unCAPTCHA, способную «взламывать» reCAPTCHA от Google, которая предлагает выбрать все изображения с дорожными знаками, витринами магазинов и так далее.

Исследователи выложили код проекта в репозиторий на GitHub. Для обхода теста Тьюринга их метод использует звуковой вариант reCAPTCHA. Аудиокапча — это серия различных чисел, которые произносятся вслух с разной скоростью и тоном на фоне белого шума. Для проведения атаки этот звуковой файл скачивается и разбивается на компоненты с речью.

После чего они загружаются в шесть бесплатных транскрибирующих онлайн-сервисов от компаний Google, IBM, Microsoft и др. Система собирает сгенерированные результаты и определяет наиболее вероятную строку эвристическим методом. Затем числа последовательно вводятся в поле капчи.

Тесты показали, что разработка ученых из Мэриленда решает 450 задач reCAPTCHA с точностью, превышающей 85% за 5,42 секунды. Это меньше, чем человек тратит на одно прослушивание аудиофайла reCAPTCHA.

Разработчики сообщили о своей работе в компанию Google и ИТ-гигант внес в систему некоторые улучшения. Например, в аудиофайлы помимо текста начали включаться небольшие кусочки текста, которые понизили успешность распознавания reCAPTCHA.

Однако отметим, что разработчики стараются не только «сломать» тест Тьюринга, но и усилить его. Например, компания Facebook начала тестирование новой капчи, которая просит пользователей социальной сети прислать свою фотографию для подтверждения личности. У компании нет собственной среды для тестирования решения, поэтому в качестве тестировщиков выступают пользователи.

Представители компании говорят, что новая технология позволит выявлять подозрительную активность на сайте, связанную с созданием учетных записей, проведением платежей или запросов на добавление в друзья. В Facebook уверяют, что процесс сверки фотографии полностью автоматизирован, а после верификации фото удаляются с серверов.

О компании Vicarious
Vicarious — компания, занимающаяся разработкой систем искусственного интеллекта. Её штаб-квартира находится в Сан-Франциско. Цель организации — создание программного обеспечения, которое позволит компьютерам думать и обучаться как человек.


P.S. Еще несколько материалов из Первого блога о корпоративном IaaS:

  • Особенности 2FA: работает ли это в облаке IaaS
  • Защита персональных данных: как это делают в Европе
  • Почему хороший IaaS-провайдер не строит свой ЦОД
  • Системы хранения данных NetApp: ретроспектива технологий
  • На что обратить внимание при выборе услуги облачного PCI DSS хостинга
  • Топ-4 рекомендаций к модернизации СХД

© Habrahabr.ru