[Перевод] Наша Вселенная — огромная нейронная сеть, и вот почему
10 сентября 2020 года мир облетела новость о том, что мир, по мнению физика Виталия Ванчурина, может быть огромной нейронной сетью. Специально к старту новых потоков курса «Machine Learning» и версии для подготовленных спецов «Machine Learning Pro + Deep Learning» представляем вам перевод материала — рассуждения о таком подходе к модели мира в свете других современных и порой весьма смелых теорий.
Несколько дней назад я прочитал статью Виталия Ванчурина на arXiv «Мир как нейронная сеть». Моей первой мыслью было, что это будет что-то о гипотезе симуляции, но, прочитав часть статьи, я понял, что она не совсем об этом. Сегодня в физике наиболее популярна теория струн (или теории, потому что их много).
Согласно теории струн, пространство имеет 9 или более измерений и фундаментальный объект — это суперструна. Струны вибрируют в пространстве высокой размерности, а каждая частица Вселенной — это вибрация суперструны. Фундаментальный объект в теории Ванчурина — нейрон; Вселенная может описываться как нейронная сеть.
Нейронные сети — это тренируемые математические структуры, вдохновлённые человеческим мозгом. Нейрон такой сети — несложный блок обработки, который обычно описывается простой математической функцией. Нейронная сеть — это также граф, его нейроны зависят от силы соединения (настраиваемых самой нейронной сетью весов). Итак, нейронная сеть — это нечто, похожее на компьютер, который программируется весами. Ванчурин в своей статье показывает, что Вселенная может описываться как нейронная сеть, и он может вывести из неё и квантовую механику, и общую теорию относительности. Это по крайней мере такая же хорошая модель Вселенной, как струны или что-то другое. Статья Ванчурина полна математики и читать её трудно, если вы не математик или физик. Ниже — суть в двух словах.
Теория Ванчурина очень впечатляет, и важно отметить, что модель нейронной сети в этой работе — не «думающая машина», она не распознаёт паттерны и т. д., которые мы используем в компьютерных технологиях. Ванчурин применяет модель нейронной сети как математическую модель частиц.
Но что, если частицы и даже пространство и время не фундаментальны во Вселенной? Нефундаментальность пространства-времени необычна, но не нова. Дональд Хоффман — большой проповедник теории «сознательной Вселенной». В его теории фундаментальная вещь — сознательный агент, а пространство-время — возникающие свойства сознательного опыта.
Если теория Хоффмана вам интересна, посмотрите его выступление на TEDили эти интервью с ним.
В конце XIX века Эйнштейн дал новое определение пространства и времени, которые были неприкасаемыми фундаментальными свойствами реальности. Он предположил, что скорость света постоянна для каждого наблюдателя, и этот закон более фундаментален, чем независимость времени.
На этом основывалась специальная теория относительности. Другой пример — квантовая механика, где нелокальность кванта предполагает нечто отличное от нашего повседневного опыта.
Хотя теория пространства и времени Хоффмана более радикальна, эти случаи — хорошие примеры того, что иногда сомнение в фундаментальных вещах может быть основой хорошей теории. В теории Хоффмана фундаментальная реальность — это иерархическая структура сознательных агентов, а вся переживаемая реальность с её пространством и временем представляет собой что-то вроде «гарнитуры» в нашем сознании, поэтому теория очень близка к гипотезе симуляции.
Несколько лет назад я написал эссе на тему «Как построить симулированную реальность?!». В этом эссе я попытался представить будущее, в котором реальна загрузка разума, и задал вопрос: каков оптимальный способ создания симулированных реальностей для загруженных сознаний?
Впервые я прочитал о выгрузке сознаний в знаменитой книге Рэя Курцвейла The Singularity is near. Выгрузка разума — это полная цифровизация человеческого мозга. Технология, где мозг копируется нейроном за нейроном и моделируется на цифровом компьютере. Если человеческий разум — это результат работы мозга, то эта имитированная копия будет полностью идентична человеческому разуму. Итак, если выгрузка разума возможна, как можно создать оптимальную симулированную реальность для оцифрованных разумов?
Первое решение
Первое решение — моделирование реальности по частям, но это очень расточительно и требует невероятно огромных вычислительных мощностей.
Тогда что можно сделать?
Можно сделать так, как делается в любой компьютерной игре: отображать только то, что видит пользователь. У нас 5 чувств, поэтому визуализации недостаточно, нужны запахи, звуки и т. д. Но модель та же: воспроизводится только то, что мы наблюдаем.
Некоторые интерпретации квантовой механики говорят нечто подобное о реальности. В этих интерпретациях реальны только наблюдаемые вещи. Но этот «трюк» не решает проблему вычислительной мощности, потому что смоделированная реальность будет согласованной только в том случае, если частицы моделируются, когда они не наблюдаются.
Например, если я держу яблоко в руке и закрываю глаза, яблоко должно быть в руке, когда я снова открываю глаза. В квантовой механике волновая функция описывает частицы, когда их никто не наблюдает, и она коллапсирует в реальный объект, когда наблюдатель наблюдает за ними.
Для моделирования волновой функции также потребуются огромные (почти бесконечные) вычислительные мощности. К счастью, есть еще один «трюк» для решения этой проблемы. Если целью является моделирование реальности для наблюдателя, достаточно учесть ожидания наблюдателя. Если мы будем придерживаться примера с яблоком, когда я открываю глаза, я ожидаю, что яблоко будет в руке.
Итак, если система знает о моих ожиданиях, она может имитировать для меня полностью согласованную реальность. Передача ожиданий — это что-то вроде проецирования реальности. Человеческий мозг делает это изо дня в день. Мы всегда воспринимаем только частички реальности, а наш мозг добавляет к ней недостающие части. Но что, если эти части реальности происходят не извне, а из проекции другого разума?
Если вам интересно, как наш мозг проецирует реальность, посмотрите выступление Анила Сета на TED по этой теме.
Моя гипотетическая система симуляции ничего не симулирует, а только «объединяет» проекции разных сознаний, чтобы создать из них непротиворечивую реальность, поэтому я называю эту симуляцию «машиной согласованности». Машина согласованности собирает прогнозы из загруженных сознаний отдельных людей, объединяет их и представляет им согласованную реальность. Машине согласования не нужна внешняя память, и ей не нужно моделировать какие-либо частицы. Она передаёт только стимулы для пяти чувств из объединённых проекций.
Но что, если машина согласованности не сможет объединить прогнозы потому, что между ними существует основное противоречие? В этом случае машина согласованности должна изменить ожидания, чтобы синхронизировать их. Ожидания индивидуального разума исходили из прошлого опыта, поэтому манипулирование разумом и изменение ожиданий — это что-то вроде путешествия во времени. Машина согласованности «возвращается в прошлое» и меняет события, чтобы синхронизировать ожидания. Это также идеальное решение для защиты модели. Если бы кто-то смог доказать, что мы живем в симуляции, машина согласованности могла бы вернуться в прошлое и залатать «дыру в безопасности». Таким образом, в этой системе вы никогда не сможете доказать, что система — симуляция.
В 2012 году Рэй Курцвейл опубликовал теорию о том, как работает человеческий разум. Согласно этой теории, неокортекс человеческого мозга построен из модулей распознавания образов. Модуль — это группа нейронов, способных распознать паттерн. Эти модули связаны между собой в иерархическую структуру. Модули нижнего уровня распознают примитивные шаблоны и отправляют сигналы вперед модулям более высокого уровня, а модули более высокого уровня, в свою очередь, могут также отправлять сигналы модулям нижнего уровня для их активации.
В этой модели мышление представляет собой что-то вроде ассоциативной цепочки активаций распознавателя образов. Во многих случаях распознаватели образов конкурируют друг с другом, и на более высоком уровне решается, какой модуль выиграл. Также в этой модели сознательный опыт является результатом конкуренции на верхнем уровне иерархии. Модель способна обеспечить согласованность на верхнем уровне. Если есть несоответствие на каком-либо уровне, распознаватель шаблонов отправляет сигналы модулям нижнего уровня, чтобы заблокировать их или изменить активации нижнего уровня.
Распознаватели образов Курцвейла — это что-то вроде сознательных агентов Хоффмана. Разница в том, что агенты Хоффмана представляют собой более абстрактные фундаментальные объекты, а распознаватели Курцвейла — это примитивные модули, построенные из группы нейронов.
Обе теории утверждают, что человеческое сознание — результат иерархии. Иерархическая сеть модулей, которая приводит к последовательному сознательному опыту, очень похожа на машину согласованности. Что, если индивидуальный разум (я) находится не на верхнем уровне в иерархии модулей, а в структуре только среднего уровня? Здесь вершина иерархии — не индивидуальный разум, а глобальное сознание верхнего уровня, содержащее индивидуальные сознания и поддерживающее согласованность переживаемой ими реальности. Это что-то вроде гигантского мозга со множеством личностей.
Хотя множественность личностей звучит странно, она не так уж необычна, как можно подумать. Один из любимых примеров Хоффмана — эксперименты с разделенным мозгом. Каллозотомия — это хирургическая процедура для лечения резистентной с медицинской точки зрения эпилепсии. При этой процедуре мозолистое тело перерезается, чтобы ограничить распространение эпилептической активности между двумя половинами мозга. После процедуры во многих случаях пациент ощущает себя двумя личностями. Такие эксперименты предполагают, что каждый человеческий мозг состоит из двух сознательных сущностей, но если две половины мозга связаны между собой, они образуют одну последовательную личность.
В модели глобального сознания индивидуальные сознания взаимосвязаны одинаково, что воспринимается этими сознаниями как непротиворечивая реальность. В такой модели пространство, время, частицы и каждый элемент реальности — результат взаимосвязи сознаний.
Если пространство-время и частицы являются только результатом взаимосвязанных сознаний, то что можно сказать о «внешней» объективной реальности? Почти ничего. Но если предположить, что глобальное сознание построено из абстрактных нейроноподобных математических структур, то можно сравнить его с текущей физической моделью.
В современной модели физического мира Вселенная возникла из ничего во время Большого взрыва, и ее самый фундаментальный строительный блок — суперструна.
Суперструны — это математические структуры большой размерности, которые образуют частицы. Каждую частицу можно описать вектором состояния, и физические законы являются операторами этих векторов. Со временем эти операторы непрерывно преобразуют векторы состояния.
Сознание — результат эволюции, а причина его образования — антропный принцип. Антропный принцип — это простой и элегантный ответ на вопрос, почему существует наша Вселенная и почему она адаптирована для осознанной разумной жизни.
Возможно, в мультивселенной есть множество вселенных, но во вселенных, которые не созданы для сознательной разумной жизни, некому спросить: «Почему моя вселенная построена именно так?». Мультивселенная играет в лотерею, и наша Вселенная выиграла джекпот: это мы. Нейросеть Вселенной подобна этому. Она также могла возникнуть из ничего, но построена из нейронов, а не из частиц. На самом низком уровне нейроны и частицы очень похожи.
И нейроны, и частицы представляют собой описываемые вектором состояния математические структуры, который непрерывно трансформируется по законам нейронов через их взаимодействия. Возможно, существует много пустых нейронных Вселенных, но некоторые из них подходят для некоей эволюции и в ней развиваются сознательные сущности.
Корректна ли эта модель для нашей Вселенной? Может быть и так, и, как написано выше, возможно, мы никогда не сможем доказать или опровергнуть, что наша Вселенная является нейронной сетью или нет.
Что можно сделать, исходя из этой теории? Если Хоффман прав и пространство-время не является фундаментальным, то, по его словам, возможно, мы сможем как-то «взломать Вселенную».
Если он не прав и сознание — результат функции мозга и может быть объяснено физическими законами, тогда мы сможем смоделировать их и в будущем построить наши собственные реальности. Так что правильный вопрос: «Когда мы будем жить в симуляции или мы уже живем в ней?»