Исследователи из MTI научили нейронные сети аргументировать свои решения08.11.2016 00:37

В последнее время нейросети показывали себя прекрасно во многих прикладных задачах. Они искали закономерности в данных, которые использовались для классификации и прогнозирования. Нейросети с кажущейся легкостью распознавали объекты в цифровых изображениях или, «прочитав» отрывок текста, резюмировали его тему. Однако никто не мог рассказать, какие преобразования проходили вводимые данные для получения того или иного решения. Даже авторы сетей владели данными на входе и информацией на выходе. И если рассматривать визуальные данные, то иногда даже можно автоматизировать опыты по выяснению, на какие составляющие изображений реагирует нейросеть. А с системами обработки текста процесс более сложный. В чем сложность понимания человеческого языка машиной вы можете прочитать ниже.

В лаборатории CSAIL (лаборатории информатики и искусственного интеллекта) Массачусетского технологического института исследователи нейросетей сделали так, что теперь «виртуальный мозг» в дополнение к решению выдает и его обоснование. Они обучали два модуля одной нейросети одновременно. Данными для обучения были текстовые отрывки. Результаты порадовали: компьютер думал, как и человек, в 95% случаев. И все же, прежде, чем запустить новый метод нейросетей в активное пользование, потребуется дополнительная настройка и доработка.

Почему картинки обрабатывать легче, чем текст? Можно ли будет беспилотным автомобилям ездить свободно, позволительно ли заменять живого доктора запрограммированным интеллектом, внутри которого бессчетное количество нейронов? Приближает ли это нас к сознательным машинам в реальной жизни? Компьютерные модели нейронных сетей ведут себя так же, как и человеческий мозг, но им пока не разрешали принимать решения, затрагивающие жизни людей. Чтобы изменить это, специалистам понадобилось время и теперь мы можем узнать, как нейросеть приходит к итоговым значениям.
Иногда в мире реальных приложений люди хотят знать, почему машина сделала именно такое предсказание, а не любое другое. Главная причина того, что доктора не доверяют решениям ИИ, — отсутствие информации о процессе принятия решения. Это касается и других сфер тоже — любой, где стоимость неверно сделанного прогноза высокая. Поэтому всем нужны доказательства и гарантии. Скорее всего, все на самом деле даже шире: вы можете не только хотеть подтвердить правильность прогноза модели, но еще и узнать, как можно повлиять на происходящее с помощью анализа. Как обычный человек может понять сложную модель, которая обучается на неизвестных алгоритмах. Эти алгоритмы могут рассказать о рациональности конкретного решения. На Гиктаймс уже задавался вопрос по теме. И вот теперь мы можем ответить положительно.

Нейросети — что?

Название «искусственные нейронные сети» говорит о том, что эти структуры ведут себя примерно как мозговые структуры человека. Составная единица такой сети — это узел обработки, который, как и нейрон, сам по себе может совершать простейшие операции. Мощь появляется, когда множество узлов объединяется в одну огромную сеть. Большая часть неизвестной работы происходит в нейроне. Это он — черный ящик. Данные на входе и выходе можно узнать. Во время обучения, операции, производимые отдельными узлами, постоянно меняются с целью получения хороших результатов по всему набору примеров для обучения. К окончанию процесса программист сети не знает, какие у узлов сейчас параметры. Даже если бы эти данные и были, то было бы сложно понять эту низкоуровневую информацию так, чтобы смочь перевести ее на понятный человеку язык.

В процессе глубокого обучения данные поступают во входные узлы сети, которые преобразуют их и передают следующим узлам. Последнее действие повторяется многократно. Процесс останавливается, когда значения поступают в выходные узлы сети. Информация коррелируется с областью данных, в которой и происходит обучение. Это могут быть объекты на изображении или тема статьи.

Как процесс стал прозрачным

Чтобы понять, как нейросеть принимает решения, исследователи решили обучать ее на текстовых данных. В институтской лаборатории команда специалистов разделила созданную сеть на две части. Одна предназначалась для извлечения кусков текста из данных обучения и оценке их по длине и последовательности. Чем короче отрывок и чем большая его часть состоит из строчек последовательных слов, тем выше оценка.

Дальше отрывки поступали во вторую часть. Вторая часть нейросети предсказывала тему отрывка или пыталась классифицировать текст. Для теста использовались онлайн-отзывы с сайта рейтинга пива. Сеть ученых попыталась оценить сорта пива по пятизвездочной шкале, основываясь на факторах: аромат, вкус, внешний вид и написанные отзывы. После обучения системы исследователи обнаружили, что их нейросеть оценивает аромат и внешний вид так же как и реальные люди: 95% и 96% соответственно. По более субъективной характеристике вкуса нейросеть «согласилась» с людьми в 80% случаев.

Модули обучались вместе, а целью тренировки было сделать максимальной оценку выбранных сегментов и точность предсказания или классификации.

На иллюстрации показан пример отзыва о пиве с ранжированием по двум категориям. Если первая подсеть выбирала такие три фразы и вторая подсеть связывала их с правильными рейтингами, то система использовала для суждения то же самое, что и человек. Также исследователи тестировали нейросеть на базе данных свободных вопросов и ответов на технические темы. Вопрос был в том, был ли конкретный ответ уже дан прежде.

Этот метод ученые применили к тысячам результатов биопсий с патологией рака груди. Анализировался текст и снимки.

В чем заключается сложность для машины понять человеческий язык?

«Трудно дать ответ, если не понимаешь вопрос.» Сарек, отец Спока в фильме Звездный путь — 4: Возвращение домой.

Обработка естественного языка — одно из направлений в искусственном интеллекте. Наша точка зрения и широкий круг знаний о мире и понимание контекста влияют на то, как мы воспринимаем даже самые элементарные структуры грамматики, связывающие слова в осмысленные словосочетания и предложения.

Объясню на примере, который приводится в книге Эрика Сигеля «Просчитать будущее». Например, словосочетания типа of India, of milk, of your. Каждая подобная часть предложения может играть разные роли в зависимости от слов, которые стоят до и после фразы. Конкретное определение будет основываться на понимании, что значат слова и что представляют собой реальные вещи, которые они называют.

1. «Time flies like an arrow.»
2. «Fruit flies like a banana.»

Если кто-то не знает эти английские лингвистические головоломки, попробуйте самостоятельно перевести предложения несколькими способами.

Время летит, как стрела.
Мухи времени любят какую-то стрелу.
Измеряйте скорость мух так же, как измеряете скорость стрелы.

Фрукт летит как банан.
Дрозофилы любят банан.

Один и тот же предлог может означать разное. Особенно, предлог WITH.

«I ate porrige with fruits.» Я съел кашу с фруктами, которые были частью блюда.
«I ate breakfast with spoon.» Я съел завтрак ложкой, которая была инструментом.
«I ate breakfast with my mom.» Я позавтракал со своей мамой, которая была участником действий.

Применение нейронных сетей

Задачи классификации. Это как раз поиск шаблонов, распознавание лиц.

Задачи прогнозирования. Как поведут себя пользователи в каких-то ситуациях. Например, банки так подсчитывают вероятность возврата кредитов при принятии решения о выдаче. Еще они исследуют стоимость кредитов, чтобы в оптимальный момент перепродать их другим банкам. Сферы применения машинного обучения: безопасность, покупательское поведение в магазинах, борьба с преступностью, маркетинг, конечно же, политика (выборы), образование, психология и управление человеческими ресурсами.

В каждой предметной области при ближайшем рассмотрении можно найти постановки задач для нейронных сетей. Вот список отдельных областей, где решение такого рода задач имеет практическое значение уже сейчас. Привожу некоторые из них.

В финансовой области нейросети прогнозируют курсы валют, стоимость сырья (временные ряды), помогают вести автоматическую торговлю на биржах, предсказывают вероятность банкротства, определяют безопасность транзакций с пластиковыми карточками. В медицинской сфере они ставят диагнозы, обрабатывают изображения, следят за состоянием пациентов, анализируют эффективность назначенного лечения. Нейросети распознают сигналы радаров, адаптируют пилотирование поврежденных летательных аппаратов, сжимают видеоинформацию, оптимизируют сотовые сети, разговаривают с нами в виде электронных помощников (Cortana, Siri), фильтруют и блокируют спам, помогают настраивать адресную рекламу. В процессах производства они способны предупреждать аварийные ситуации и контролировать качество продукции. В робототехнике — прокладывают маршруты движения роботов, контролируют манипуляторы.

Значительно облегчают жизнь специалистам по безопасности и охранным системам — тут нейросети занимаются идентификацией личностей по отпечатку пальца, голосам, подписям и лицам. Для геологов сети анализируют сейсмические данные и отыскивают полезные ископаемые при помощи ассоциативных методик.

Как медицина может полагаться на бездоказательные решения нейросетей? Но, разве решения, принятые человеком, разумом вперемешку с эмоциями, всегда можно считать абсолютно верными для конкретного случая? Есть, конечно, комиссии врачей, но их не всегда получится собирать. Так что в нашей не всегда доказательной медицине решения до сих пор принимают люди со специфической подготовкой. Человеческий фактор, врачебная ошибка против вероятного ложного срабатывания искусственного интеллекта. Может, дело в том, что в случае с машиной нет конкретного виноватого?… В природе человека — искать ответы, оправдывать и обосновывать решения перед своим же собственным мозгом. Человеку всегда легче, когда известно, кто виноват.

То же и на дорогах. Машине непростительно сбить человека так же, как непростительно другому человеку, нарушившему правила, причинить вред. А всегда ли виновный получает объективное наказание? Вопросы морали так и останутся вечными. Наверное, одного общего ответа нет. Когда самоуправляемые автомобили от BMW или Google станут обыденностью на улицах городов, люди примут машинный риск. И хотя в некоторых случаях в смерти человека причиной будет компьютер-водитель, общее количество аварий и жертв резко уменьшится благодаря роботам.

Больше всего за этичность нейросетей борются компании, производящие автомобили с самоуправлением. Вопрос: как должен поступить автопилот, когда перед ним двое детей играют в мяч прямо на перекрестке. Кто должен подвергнуться опасности: заведомо нарушающие правила (!) дети или пассажиры автомобиля.
Этот пример напоминает классическую этическую задачу, в которой вы оператор дорожной стрелки, на одном пути группа людей, а на другом кто-то один. Решение всегда будет несправедливым по отношению к жертве, его родственникам и спасет остальных. Хотя люди, которые выживут такой ценой тоже могут быть не рады.

Эволюционная похожесть на мозг

Существует понятие нейродарвинизма. Он включает в себя механизм самозагрузки, который работает на обратной связи между окружающей средой и мозгом. Даже самые простые компьютерные модели нейронных сетей, если их запрограммировать на удаление невыгодных для существования конфигураций и воспроизведение выгодных, достигают удивительных уровней сложности за короткое время. Я это к чему, никакие структуры в реальном мире не созданы с целью самоуничтожения. Любое существо запрограммировано на жизнь. И нейросети тоже. Даже такое, на наш взгляд, простое существо, как мушка-дрозофила, имеет сложную систему связей в мозгу. Это ее мозг вы видели на изображении в начале.

Как человеческий мозг работает с изображениями

Как пишет Рита Картер, в книге «Как работает мозг», информация-воспоминания о лицах знакомых нам людей хранятся в мозге как особые нейронные сети (Единицы Распознавания Лиц). Когда мы видим новый образ, он сопоставляется с нашим опытом путем сканирования ЕРЛ. Если есть что-то связывающее, то та ЕРЛ становится активной и соединяется с последним увиденным образом. Мозг ведет себя одинаково, будь новый образ увиден на улице или сгенерирован самостоятельно сознанием человека. Чем чаще сознание обращается к сохраненным образам, тем активнее соответствующие нейросети. Ненужные же сети со временем распадаются. Это то, что мы называем «совсем забыл».

Сознание

Зачем я провожу аналогии с человеческим мозгом? Может, дело не только в том, чтобы доверять компьютерным нейросетям? Возможно, это вопрос понимания и принятия. Да, другой человек, как существо полностью принимаемое нами за «свое» в отличие от механического компьютера, объяснит и обоснует любое решение так, что мы поймем. А если он врет? А если он психически болен? Всюду остаются нюансы. У машин нет сознания, а значит нет и проблем этического характера — они всегда более объективны и беспристрастны. Но у исследователей не получается оставить их только для определенных сфер, типа создания лучшей шахматной комбинации, проектирования сложных систем, а, значит, и нам, людям надо приспосабливаться тоже. Хоть это и сложно. Как и чувствовать любую грань между механическим и эмоциональным. Но таково будущее, описанное в научно-фантастических романах прошлого, которые уже давно начали становиться нашей повседневной жизнью.

Таким образом, сделан еще один шаг в сторону понимания в паре человек-машина. Хочу привести слова Роджера Пенроуза, профессора математики из Оксфордского университета.

Понимание требует осознания. Иллюзия понимания появляется из-за всесторонней обработки большого количества данных. Вычисление и понимание — это дополняющие друг друга вещи.

«Я полагаю, что для объяснения понимания нам обратиться к новым физическим концепциям с квантовым миром, математическая структура которого по большей части неизвестна.»

Пенроуз говорит, что понимание порождает особый компонент мозговых тканей.

«В теле человека есть микротрубочки, особенно их много в нервных кетках.»

Ученый предлагает исследовать, возможно ли то, что микротрубочки создают стабильные квантовые состояния, которые связывают клеточную активность по всему мозгу, порождая сознание. Компьютерное моделирование этого состояния невозможно.