Эмоциональные вычисления
Когда эмоциональные вычисления сформировались как отдельное направление исследований? Можно ли перенести человеческие эмоции на вычислительные системы? Почему важно добиваться от роботов эмоциональной отдачи? На эти и другие вопросы отвечает преподаватель Университета Иннополис Максим Таланов.
Появление направления эмоциональных вычислений, или Affective Computing, относится к 2000 году, когда Розалинд Пикард опубликовала свою книгу под названием Affective Computing. Эта книга послужила отправной точкой для исследований в MIT, в MediaLab.
Впоследствии все больше и больше ученых из Университета Южной Калифорнии, из Швеции, из многих стран стали интересоваться данным направлением. Стало ясно, что, исходя из эволюционной роли эмоций внутри естественного интеллекта, искусственный интеллект очень многое упускает и что в нем невозможно воплотить очень многие вещи, которые связаны с эмоциональной картиной, с эмоциональным состоянием внутри человека.
Это связано с успехом нейробиологов, которые на основе нейромодуляторов, принимающих активное участие в эмоциях человека, находят связь, например, с принятием решений. Оказалось, что наше быстрое принятие решений, когда мы не проходим по полному графику или не применяем эвристику, связано с тем, что информация в нашем мозгу эмоционально отсвечена, мы часто принимаем решения просто под воздействием того или иного эмоционального импульса. Не воплощая это, мы не используем эти быстрые механизмы при принятии решений.
Это значит, что роботизированные системы, или системы искусственного интеллекта, становятся нежизнеспособны в условиях реального мира, при которых мы каждый раз, просто выходя на улицу, принимаем громадное количество решений. Повернуть голову в сторону громкого звука или не поворачивать, проигнорировать его? Переходить ли улицу или не переходить, когда мы видим, что там едут машины или какая-нибудь машина угрожает нашей жизни? Все это часто происходит бессознательно, но носит эмоциональную окраску, потому что вовлекает в себя много подкортикальных структур, которые есть в голове, и они в том числе сильно влияют на мыслительный процесс. Нейробиологами было замечено, что мозг работает в эмоциональном цикле. Кора головного мозга влияет на подкортикальные и прочие структуры таламуса, вызывая тот или иной эмоциональный фидбэк, обратную связь, которая опять же влияет на кору. Мы находимся в этом эмоциональном цикле.
У Марвина Мински есть очень интересное замечание по поводу эмоциональных циклов. У человека есть — он называет это багом, то есть ошибкой, — в мозгу такая ошибка: мы можем воспроизводить то или иное эмоциональное состояние, находясь как бы в зацикленности. У нас даже есть специальный термин «зацикленность», аналогичный есть и в английском языке. Мы воспроизводим какое-нибудь эмоциональное состояние, нам, может быть, просто нравится находиться в нем, и мы часами находимся в этом состоянии. Здесь нам поможет только одно — просто выйти из этого процесса, например, с помощью рефлексии. Мы находимся в этом низкоуровневом нейробиологическом эмоциональном цикле, постоянно воспроизводим то или иное эмоциональное состояние. Например, когда мы находимся в депрессии: «Почему он так ужасно поступил со мной? Это совершенно несправедливо». Или, наоборот, мы воспроизводим эйфорическое состояние: если вы ездили на мотоцикле, то вы все время вспоминаете, как вам классно ездить на мотоцикле, выделяете заново опиаты и допамин в мозг просто потому, что вам это нравится. И в действительности вы уже не едете на мотоцикле, а просто вспоминаете это и находитесь в этом цикле.
Все это приводит к тому, что мы обращаемся к определенной области нейробиологически инспирированных систем. И эти эмоциональные вычисления оказывают влияние на очень серьезные аспекты, на нейробиологически инспирированные системы.
Здесь происходит разделение между двумя направлениями, которые очень тесно связаны. Во-первых, определение эмоций внутри человека по его лицу, жестикуляции и так далее. Это направление, которое очень интенсивно развивается в Соединенных Штатах под руководством Розалинд Пикард. У них очень интересная лаборатория, они закрепляют камеры перед собой, с какой-то периодичностью снимают выражения лиц и одновременно динамически собирают данные: проводимость кожи, пульс, давление и так далее. Это первое очень интересное направление в плане изучения человеческих эмоций.
Другое направление, которым мы пытаемся заниматься, — это воспроизведение человеческих эмоций внутри вычислительных систем.
Исходя из того, что они оказывают очень серьезное влияние на человеческие мыслительные процессы, соответственно, их необходимо воспроизводить внутри вычислительных систем, таких как направленные на социальное взаимодействие интеллектуальные агенты.
Было замечено, что, по мнению даже не исследователей, а инженеров, которые создают этих интеллектуальных агентов, например, в мобильных устройствах, людям неинтересно общаться с неэмоциональными агентами, со стороны которых нет никакой эмоциональной отдачи, emotional feedback. Мы не получаем никакой эмоциональной отдачи от них, с ними неинтересно общаться, они неспособны на ту реакцию, которую мы в действительности ожидаем.
В этом направлении действует достаточно большое количество ученых. Но есть определенные сложности, связанные с воспроизведением эмоций внутри вычислительных систем. Внутри вычислительных систем нет нейронов, нет нейромодуляторов. Внутри вычислительных систем есть только вычислительный процесс, что нам достаточно хорошо известно.
Это соответствие далеко не линейно, и из-за него нам приходится создавать достаточно сложные теории, чтобы понять, как в целом собираются те или иные психологические феномены и как мы можем воспроизвести это внутри вычислительных систем.
О нейробиологически инспирированных системах. Во-первых, есть очень интересный проект Правительства Соединенных Штатов. Они выделяют 300 миллионов долларов в год для воспроизведения эмоций. Но они смотрят на прикладной аспект этих исследований, то есть воспроизведение в виде микросхем, в виде программного обеспечения. И в результате была создана нейробиологически инспирированная архитектура TrueNorth. Эта архитектура не фоннеймановская, она закладывает новые основы для нейробиологически инспирированных систем, чтобы воссоздать нейронные сети не на уровне симуляции в виде программного обеспечения, а на уровне симуляции в виде железа, hardware, в виде микросхем.
В действительности наш головной мозг потребляет примерно 20 Вт электроэнергии, как лампочка. При этом последняя симуляция одного процента коры головного мозга, которая была проведена в японском Институте Рикэн (RIKEN) в 2013 году, заняла 250 суперкомпьютеров «Кей», о чем было достаточно громогласно объявлено. Это достаточно серьезный успех. Но дело в том, что, во-первых, этих суперкомпьютеров 250, во-вторых, на борту каждого этого суперкомпьютера находится 80 тысяч процессоров, и представьте себе, какое количество электроэнергии это все может потреблять.
В целом симуляция была примерно в тысячу раз медленнее, чем реальная работа коры головного мозга. Интересное сравнение: 20 Вт в живых системах и 250 суперкомпьютеров, которые поедают достаточно серьезное количество электроэнергии. Эффективность совершенно не на стороне современных вычислительных систем.
Это говорит о том, что нам нужна новая архитектура, на что нацелен проект BRAIN Правительства Соединенных Штатов, и эти новые микросхемы, которые воспроизводят до миллиона нейронов в зависимости от архитектуры. Есть аналогичная разработка у Университета Стэнфорда: они воспроизводят около миллиона нейронов на борту каждой микросхемы. При этом специалисты из IBM пошли дальше: они уже создали материнскую плату, в которой собрали массив 4×4, по 16 миллионов нейронов.
С одной стороны, это не так много, потому что масштаб коры человеческого мозга от 18 до 21 миллиарда нейронов, а общий объем — 86 миллиардов нейронов. С другой стороны, это масштабы, которые становятся интересными. Потому что, например, у мыши 4 миллиона нейронов. Соответственно, мы попадаем в масштаб коры головного мозга мыши, а это уже млекопитающее, у которого есть весь необходимый эмоциональный багаж, есть уже кора головного мозга.
Более интересно посмотреть на историческую перспективу, как это развивалось.
В 2011 году у той же IBM был чип, который воспроизводил всего 256 нейронов. А сейчас мы имеем 1 миллион.
То есть был скачок на три порядка. Если будет следующий скачок, то, может быть, мы выйдем уже на масштабы коры человеческого мозга. Здесь мы видим очень интересные перспективы, а именно самообучающиеся системы, о которых пока, к сожалению, специалисты IBM не говорят. Я не знаю, по каким причинам, может быть, это слишком страшно.
Но, когда мы выходим на самообучающиеся системы, что происходит? Мы не программируем котят, мы не программируем мышей, мы не программируем детей. Почему? Потому что это не нужно. Они самообучаются, поэтому их не надо программировать. Соответственно, мы говорим о том, что подобные агенты, подобные самообучающиеся системы не будут нуждаться в программировании, как оно существует сейчас: с кнопочками, модулями и прочим. К ним нужно будет применять совершенно другие техники, известные в педагогике, в детских садах.
Мы уже начинаем говорить об аспекте детства для агентов искусственного интеллекта. Это поворачивает все перспективы в совершенно другую сторону.
Полный текст статьи читайте на Postnauka.ru