[Перевод] Почему человеческий мозг так эффективен?
Как массивное распараллеливание возвышает эффективность мозга над возможностями ИИ
Мозг — устройство сложное; у людей он содержит порядка 100 млрд нейронов и около 100 триллионов соединений между ними. Его часто сравнивают с другой сложной системой с огромными возможностями решения задач: цифровым компьютером. В мозге и компьютере содержится большое количество элементарных единиц — нейронов или транзисторов, соответственно — подключенных к сложным схемам, обрабатывающим информацию, передаваемую электрическими сигналами. На глобальном уровне архитектуры мозга и компьютера немного похожи, поскольку состоят из практически отдельных контуров для ввода, вывода, центральной обработки, и памяти.
Кто лучше справляется с решением проблем — мозг или компьютер? Учитывая быстрое развитие компьютерных технологий в последние десятилетия, можно решить, что побеждает компьютер. И действительно, компьютеры разрабатывают и программируют с целью победы над человеческими мастерами в сложных играх, таких, как шахматы в 1990-х, и го, совсем недавно –, а также в конкурсах на энциклопедические знания, таких, как телевикторина «Jeopardy!» Но пока что люди побеждают компьютеры во множестве задач, связанных с реальным миром — от способности различить на дороге велосипедиста или пешехода до поднятия со стола чашки с чаем и аккуратного перемещения её ко рту — не говоря уже о концептуализации и творчестве.
Почему же компьютер хорошо справляется с определёнными задачами, а мозг — с другими? Сравнения компьютера с мозгом помогали инженерам и нейробиологам разбираться в этом вопросе. Следующее сравнение было проведено на заре современной эры компьютеров, в небольшой, но влиятельной книге «Компьютер и мозг» [The Computer and the Brain] Джона фон Неймана, специалиста во многих областях науки, в 1940-х первым разработавшего схему компьютерной архитектуры, до сих пор служащую основой современных компьютеров. Давайте посмотрим на числа в этих сравнениях.
Свойства | Компьютер | Мозг |
---|---|---|
Количество элементарных элементов | До 10 млрд транзисторов | ≈ 100 млрд нейронов и 100 трлн синапсов |
Скорость базовых операций | 10 млрд/сек | < 1000 / сек |
Точность | 1 на 4,2 млрд (у 32-битного процессора) | 1 к 100 |
Энергопотребление | 100 Вт | 10 Вт |
Метод обработки информации | В основном последовательный | Последовательный и массивно параллельный |
Количество входов и выходов у каждого элемента | 1–3 | ≈ 1000 |
Режим работы | Цифровой | Цифровой и аналоговый |
Данные взяты от компьютеров 2008 года. Количество транзисторов на интегральную микросхему удваивалось каждые 18–24 месяца, но с течением времени прирост быстродействия уменьшался из-за проблем с энергопотреблением и рассеиванием тепла.
У компьютера есть огромные преимущества над мозгом в скорости базовых операций 1. Сегодня персональные компьютеры способны выполнять такие элементарные арифметические операции, как сложение, со скоростью в 10 млрд операций в секунду. Скорость элементарных операций мозга мы можем оценить по элементарным процессам, при помощи которых нейроны передают информацию и общаются друг с другом. К примеру, нейроны активируют потенциалы действия — всплески электрических сигналов, запускающихся поблизости от клетки нейрона, и передающихся по его длинным ответвлениям, аксонам, связывающих его со следующими нейронами. Информация кодируется в частоте и времени начала этих всплесков. Максимальная частота активации нейрона составляет порядка 1000 всплесков в секунду. В другом примере нейроны передают информацию связанным с ними партнёрским нейронам, испуская химические нейромедиаторы в специальных структурах на концах аксонов, синапсах, а партнёрские нейроны превращают присоединение нейромедиаторов обратно в электрические сигналы, и этот процесс называют синаптической передачей. Самая быстрая синаптическая передача происходит за 1 мс. Поэтому, путём всплесков и синаптических передач, мозг способен выполнять максимум тысячу базовых операций в секунду, что в 10 млн раз медленнее компьютера. Предполагается, что арифметические операции должны преобразовывать ввод в вывод, поэтому скорость работы ограничена базовыми операциями коммуникаций нейронов, таких, как потенциалы действия и синаптическая передача. Но у этих ограничений бывают исключения. К примеру, нейроны с электрическими синапсами (связями между нейронами, не использующие химических нейромедиаторов) не выдающие всплески, в принципе способны передавать информацию быстрее, чем за миллисекунду; также на это способны события в дендритах, происходящие локально.
У компьютера также есть серьёзные преимущества перед мозгом в точности базовых операций. Компьютер способен представлять числа с любой нужной точностью при помощи битов, нулей и единиц, назначенных каждому числу. К примеру, 32-битное число имеет точность 1 к 232, или 4,2 млрд. Эмпирические свидетельства говорят о том, что большая часть чисел в нервной системе (к примеру, частота активации нейронов, которую часто используют как оценку интенсивности стимула) колеблется на величину в несколько процентов из-за биологического шума, то есть точность, в лучшем случае, равняется 1 к 100, что в миллионы раз хуже, чем у компьютера. Кстати, шум может служить индикатором того, что многие нервные процессы являются по сути вероятностными. Одни и те же стимулы могут вызывать разные последовательности всплесков электрической активности нейронов.
Однако подсчёты, осуществляемые мозгом, нельзя назвать медленными или неточными. К примеру, профессиональный теннисист может следить за траекторией мяча, летящего со скоростью до 260 км/ч, переместиться на оптимальное место на корте, поставить руку в нужную позицию и махнуть ракеткой, возвращая мяч на половину соперника — и всё это за несколько сотен миллисекунд. Более того, мозг способен на все эти задачи (с помощью тела, которое он контролирует), потребляя в десять раз меньше энергии, чем персональный компьютер. Как мозгу это удаётся? Важное отличие между компьютером и мозгом — это режим, в котором каждая из этих систем обрабатывает информацию. Компьютер выполняет задачи по большей части по последовательным шагам. Это можно видеть по тому, как программисты пишут код, создавая поток последовательных инструкций. Для каждого шага этой последовательности требуется высокая точность, поскольку ошибки накапливаются и усиливаются на каждом шаге. Мозг также использует последовательные шаги при обработке информации. В примере с теннисом информация переход из глаз к мозгу, а затем в спинной мозг для управления сокращениями мускулов ног, туловища, руки и запястья.
Но мозг также использует и массивную параллельную обработку данных, пользуясь преимуществом в виде огромного количества нейронов и связей между ними. К примеру, движущийся теннисный мяч активирует множество клеток сетчатки, фоторецепторов, которые преобразовывают свет в электрические сигналы. Эти сигналы передаются множеству различных типов нейронов сетчатки. К тому времени, когда сигналы фоторецепторов пройдут через два-три синаптических соединения в сетчатке, информация о положении, направлении и скорости мяча уже извлечена параллельными нейронными контурами, и передана мозгу. Точно так же двигательная кора (часть коры мозга, отвечающая за сознательную моторику) параллельно отправляет команды для контроля сокращения мускулов ног, туловища, рук и запястья, так, что тело и руки одновременно занимают нужно положение, оптимальное для приёма мяча.
Эта массивно параллельная стратегия работает, поскольку каждый нейрон собирает входные данные и отправляет выходные множеству других нейронов — в среднем для млекопитающих по 1000 входящих и исходящих связей у каждого нейрона. А у каждого транзистора в сумме есть только три узла для входа и выхода. Информация от одного нейрона может идти по множеству параллельных путей. И в то же время, множество нейронов, обрабатывающих информацию, могут соединить свои выходные данные, направив их одному последующему нейрону. Это свойство особенно полезно для увеличения точности обработки информации. К примеру, информация, представленная единственным нейроном, может содержать шум (то есть, её точность порядка 1 к 100). Воспринимая входные данные от 100 нейронов, обрабатывающих одинаковую информацию, следующий по очереди нейрон уже может представлять информацию с более высокой точностью (в данном случае, 1 к 1000). Допустим, среднеквадратичное отклонение σсред для каждой единицы входных данных примерно соответствует шуму. Для среднего количества независимых входов n ожидаемое отклонение средних σсред = σ / √ n. В нашем примере σ = 0,01, а n = 100, поэтому σсред = 0,001.
У компьютера и мозга есть сходства и различия также в представлении их элементарных единиц. Транзистор использует цифровое представление информации с дискретными значениями (0 или 1). Всплеск аксонов — это тоже цифровой сигнал, поскольку нейрон в каждый момент времени либо активируется, либо не активируется, а когда он активируется, почти у всех всплесков оказываются примерно одинаковые величина и форма. Это свойство позволяет надёжно передавать всплески на большие расстояния. Однако нейроны также используют возможности аналоговых сигналов, представляющих информацию при помощи непрерывных значений. Некоторые нейроны (большинство нейронов сетчатки) не дают всплески, и их выходная информация передаётся ступенчатыми электрическими сигналами (которые, в отличие от всплесков, могут варьироваться по величине), которые способны передавать больше информации, чем всплески. Принимающий конец нейрона (обычно находится в дендритах) также использует аналоговые сигналы для интегрирования до тысячи входных сигналов одновременно, что позволяет дендритам выполнять сложные вычисления. 7
Ещё одно заметное свойство мозга, которое явно задействовано в примере с игрой в теннис, заключается в том, что силу связей между нейронами можно изменять в результате действий и опыта — этот процесс, как считается нейробиологами, является основой обучения и запоминания. Повторяющиеся тренировки позволяют нейронным контурам лучше настраиваться под выполнение задач, что серьёзно увеличивает скорость и точность.
За последние десятилетия инженеры вдохновлялись мозгом, чтобы улучшать компьютеры. Принципы параллельной обработки и модификации весов связей, зависящие от использования, включены в современные компьютеры. К примеру, в разработке компьютеров современной тенденцией служит увеличение параллелизма, например, использование нескольких процессоров (ядер) в одном компьютере. Ещё один пример — глубинное обучение, наука о машинном обучении и искусственном интеллекте, достигшая огромных успехов в последние годы, и отвечающая за быстрый прогресс в распознавании объектов и речи у компьютеров и мобильных устройств, было вдохновлено открытиями, связанными со зрительной системой млекопитающих. 2
Глубинное обучение, подражая зрительной системе млекопитающих, использует несколько слоёв, каждый из которых представляет всё более абстрактные свойства объекта (визуального или речевого), а веса связей между различными слоями подстраиваются при помощи обучения, а не за счёт инженерных усилий. Эти недавние подвижки расширили список задач, подвластных компьютерам. И всё же у мозга остаётся превосходящая компьютеры гибкость, обобщаемость и способность к обучению. По мере того, как нейробиологи будут открывать всё больше секретов мозга (чему помогает всё более активное использование компьютеров), инженеры смогут брать больше примеров для вдохновения у мозга, чтобы и дальше совершенствовать архитектуру и быстродействие компьютеров. Кто бы ни оказался победителем в выполнении конкретной задачи, это взаимное междисциплинарное оплодотворение несомненно продвинет как нейробиологию, так и вычислительную технику.
1. Patterson, D.A. & Hennessy, J.L. Computer Organization and Design (Elsevier, Amsterdam, 2012), 4th ed.
2. LeCun, Y. Bengio, Y., & Hinton, G. Deep learning. Nature 521, 436–444 (2015).
Ликан Люо — профессор Школы гуманитарных и точных наук, а также профессор нейробиологии в Стэнфордском университете.