В DeepMind создали компьютер, который сам учится использовать свою память13.10.2016 23:37

DeepMind разработала новый тип ИИ, способный учиться использовать собственную память. Проект получил название «Дифференциальный нейронный компьютер» (Differential Neural Computer, или DNC).

Какие последствия может иметь проект, цель которого — «научить» компьютер использовать собственную память? Главное — слабая форма ИИ становится более эффективной, чем когда-либо. Например, такая система может помочь человеку передвигаться в полностью незнакомом городе без малейших неудобств.

Иллюстрация архитектуры DNC. Контроллер нейронной сети получает извне информацию, используя данные для работы памятью посредством специфических операций чтения/записи. Для того, чтобы помочь контроллеру работать с памятью, DNC сохраняет временные ссылки на отслеживание записанных данных, а также фиксирует текущие уровни использования для каждого участка памяти.

Главное достижение сотрудников DeepMind состоит в том, что они смогли научить свой ИИ выполнять каждую последующую задачу, не забыв о том, как проходило выполнение предыдущих. В обычной ситуации система может использовать одну и ту же область памяти для записи информации по выполнению различных задач. Выполнив первую задачу, машина начинает выполнять вторую. А данные о выполнении первой замещать данными по выполнению второй.

DNC играет в «пятнашки»

DNC от DeepMind так не делает. Сотрудники компании предоставляют нейронной сети участок памяти во внешнем носителе, и обучают систему, как его можно использовать. Процесс обучения при этом носит характер проб и ошибок. На своем сайте представители проекта заявили следующее: «Когда DNC генерирует ответ, мы сравниваем его с желаемым правильным ответом. С течением времени система учится давать ответы ближе и ближе к правильному».

Сердце DNC — нейронная сеть, которую назвали контроллером. Создатели системы проводят здесь аналогию с процессором в компьютере. Контроллер отвечает за получение данных, запись их в память и чтение из памяти. Кроме того, контроллер анализирует данные и формирует ответ в ответ на заданный системе вопрос.

Контроллер выполняет несколько типов операций в памяти. Каждое мгновение он решает, писать в память что-то или нет. Если решение «да», то контроллер может выбрать два варианта записи — в неиспользованном секторе или же в секторе, где уже есть информация, которую ранее искал контроллер. Это обеспечивает возможность обновления информации, записанной в каком-то фиксированном секторе. Если все секторы в памяти использованы, контроллер может принять решение освободить память, подобно тому, как на обычном жестком диске можно перезаписать сектор, который более не является необходимым.

Так же, как и в случае записи, контроллер может считывать данные с ряда секторов. Система может искать нужную информацию в каждом секторе, или же сразу считывать данные, которые сохранены в секторе, имеющем отношение к запрошенным данным.

Все это позволяет системе эффективно решать вопрос об использовании памяти, сохранении данных и их поиске.

[embedded content]

После того, как нейронная сеть получила карту метро Лондона, компьютер сразу начал давать сложные ответы на сложные вопросы о перемещении по метрополитену. Эти ответы базировались на принципе дедукции. Вот пример одного из вопросов, на который DNC может ответить правильно сразу же после загрузки в память системы карты метрополитена: «Когда мы заходим в вагон метро и проезжаем одну остановку по Центральной линии, потом по Кольцевой линии еще четыре остановки, и по линии Джубили еще две остановки, на какой остановке мы выйдем?». Для цифровых ассистентов типа Siri такой вопрос является неподъемным — правильный ответ они найти просто не смогут, несмотря на всю вычислительную мощь дата-центров Apple. А вот ИИ от DeepMind вполне в состоянии дать правильный ответ.

Источник: Photofusion/Getty

Более того, эта система может дать совет о сокращении пути между разными остановками. Правильный ответ она дает в 9 случаях из 10.

По словам разработчиков, их система может дать правильный ответ потому, что принцип ее работы имеет схожесть с фундаментальными принципами мышления человека. Конечно, до настоящего машинного аналога человеческого интеллекта системе от DeepMind еще далеко, но и текущий вариант работает отлично. Мозг человека все же более умело распоряжается хранимыми данными, включая процесс размещения новой информации.

Специалисты DeepMind надеются, что в будущем они смогут создать систему, которая без введения в ее память специализированных программ сможет использовать доступную ей информацию для решения определенных проблем. В этом случае можно уже говорить о полноценной самообучающейся системе, способной использовать имеющиеся данные для решения сложных задач.

Пока что неясно, когда Alphabet сможет использовать достоинства новой системы в своих коммерческих продуктах и сервисах. Пока что команда подразделения проводит глубокие исследования и ничего не говорит о том, когда начнется коммерческое использование разработанной системы.

Специалисты считают, что компания далеко продвинулась в исследованиях ИИ, Герберт Хаегер (Herbert Jaeger) из Бременского университета Якобса, заявил, что команда DeepMind «преодолела один из важнейших этапов эволюционного развития современных нейронных систем». Этот ученый уверен, что на самом деле компания создала нечто более значительное, чем описано ее представителями в статье в журнале Nature.

Как и все прочие проекты DeepMind, этот основан на глубоком обучении. Практически той же технологии, которая помогла системе AlphaGo победить в 4 играх по го из 5 чемпиона мира Ли Седоля.

Сейчас DeepMind совместно с Институтом будущего человечества (Future of Humanity Institute) занимается еще одной интересной работой. Объединенная команда специалистов создает «красную кнопку» для сильной формы ИИ. Это инструмент, который позволит выключить искусственный интеллект в том случае, если он выйдет из-под контроля.

Проблема в создании такого инструмента хорошо показана в высказывании Ника Бострома, директора Института будущего человечества: «Если интеллектуальный взрыв угрожает нам исчезновением, то мы должны понять, можем ли мы контролировать процесс детонации. Сегодня было бы более разумным ускорить работу по решению проблемы контроля, нежели приостанавливать проведение исследований в области искусственного интеллекта. Но пока решением проблемы контроля занимаются человек шесть, в то время как над созданием искусственного интеллекта трудятся десятки, если не сотни тысяч».