Глаза боятся, а ИИ делает: как эмоции помогают ИИ лучше управлять автомобилем

В последние годы технологии автономного вождения привлекают пристальное внимание ученых и бизнеса по всему миру. От их внедрения ожидают значительных общественных выгод — повышения безопасности на дорогах, снижения загруженности и вредных выбросов. Однако аспект безопасности до сих пор вызывает серьезную озабоченность, мешая широкому внедрению. Реальные дорожные сценарии неизбежно несут неопределенность, из-за чего автономные автомобили могут вести себя непредсказуемо и опасно, порой с фатальным исходом. 

Современный ИИ достиг впечатляющего прогресса, стимулируя сферу автономного транспорта. Особенно перспективно выглядит обучение с подкреплением (RL), показавшее успехи в сложных задачах принятия решений вроде игры в Го или управления беспилотными автомобилями. Поэтому исследователи активно изучают применение RL в автопилотах.

4c6a8dc5393f2773cebf2c720e1259b4.png

Но существующие подходы не дают гарантий безопасности, что ограничивает использование RL там, где оно имеет решающее значение. Учитывая это, предпринимаются попытки разработать безопасные методы RL для защиты автономных автомобилей. Распространена идея дополнять традиционные алгоритмы RL проверками и ограничениями, чтобы одновременно оптимизировать стратегии вождения и повышать безопасность. Тем не менее, все равно происходит неизбежное столкновение с опасными ситуациями в попытках их избегать.

В свете этого некоторые эксперты призывают активнее исследовать нейро-ИИ — перспективное направление следующего поколения ИИ. В основе методики лежит понимание поведения мозга из нейробиологии и психологии. Считается, например, что дофаминергические нейроны среднего мозга отвечают за сигналы вознаграждения, позволяя обучаться поощряемому поведению. 

В последнее же время появляется все больше свидетельств того, что в процессах RL в мозге ключевую роль играет миндалевидное тело, отвечающее в том числе за реакции на опасности. С учетом этого, было проведено исследование с целью установить связи между ИИ, нейронаукой и психологией, чтобы разработать новые безопасные методы RL для автопилотов путем моделирования функций миндалевидного тела и ответить на вопрос «Могут ли некоторые из тех же признаков страха и оборонительного вождения быть как-то запрограммированы в беспилотный автомобиль?»

Исследование называется » Fear-Neuro-Inspired Reinforcement Learning for Safe Autonomous Driving» (Обучение с подкреплением на основе нейронной модели страха для безопасного автономного вождения) и ознакомиться с ним можно здесь.

Сразу небольшой спойлер: да, системы ИИ могут стать более безопасными и осторожными водителями, получив нейронные черты, аналогичные тем, которые люди испытывают, когда чувствуют страх.  

Схема предлагаемой системы FNI-RL для безопасного автономного вождения. (a) Функциональные системы мозга, связанные с RL. (b) Модуль адверсивного воображения для моделирования механизма миндаливидного тела. (c) Техника критики агента с ограничением страха. (d) Контур взаимодействия агента и среды.

Схема предлагаемой системы FNI-RL для безопасного автономного вождения. (a) Функциональные системы мозга, связанные с RL. (b) Модуль адверсивного воображения для моделирования механизма миндаливидного тела. © Техника критики агента с ограничением страха. (d) Контур взаимодействия агента и среды.

Более того, как выяснили исследователи, этот трюк может помочь системе автономного управления автомобилем работать более безопасно, чем другие передовые системы автономных транспортных средств. Новый вид «вдохновленного страхом» метода обучения с подкреплением оказался неожиданно полезным для повышения безопасности беспилотных автомобилей.  

Страх как двигатель прогресса

Чэнь Лв (Chen Lv), доцент и директор исследовательской лаборатории AutoMan в Школе машиностроения и аэрокосмической техники в Технологическом университете Наньян в Сингапуре, участвовал в создании этой новой системы. Он отмечает, что за последние годы области нейронауки и психологии углубляются в изучение внутреннего устройства человеческого мозга, включая миндалевидное тело — часть мозга, которая регулирует эмоции. «Страх, возможно, является самой фундаментальной и важной эмоцией как для людей, так и для животных с точки зрения выживания», — говорит Лв.  

Исследования в области психологии и нейронауки показали, что не только страх, но и воображение и прогнозирование опасных ситуаций играют роль в выживании. «Мотивированные этими идеями, мы разработали парадигму машинного интеллекта, похожую на мозг… чтобы приобрести чувство страха, тем самым повышая или обеспечивая безопасность», — объясняет Лв.

Агенты автономного вождения, разработанные командой Чэнь Лв, как он говорит, научились справляться с опасными сценариями путем итерации и прогнозирования, тем самым значительно снизив частоту, с которой система принимает небезопасные решения или действия при взаимодействии с реальной окружающей средой.  

Экспериментальные дорожные среды. (а) Незащищенный левый поворот на нерегулируемом перекрестке с встречным потоком транспорта. (б) Правый поворот на нерегулируемом перекрестке с пересекающимся потоком транспорта. (в) Незащищенный левый поворот на нерегулируемом перекрестке со смешанными потоками движения. (г) Пересечение на нерегулируемом перекрестке со смешанными потоками движения. (д) Долгосрочная целенаправленная навигация со смешанными потоками движения.

Экспериментальные дорожные среды. (а) Незащищенный левый поворот на нерегулируемом перекрестке с встречным потоком транспорта. (б) Правый поворот на нерегулируемом перекрестке с пересекающимся потоком транспорта. (в) Незащищенный левый поворот на нерегулируемом перекрестке со смешанными потоками движения. (г) Пересечение на нерегулируемом перекрестке со смешанными потоками движения. (д) Долгосрочная целенаправленная навигация со смешанными потоками движения.

«Мы можем представить себе различные неприятные или пугающие сценарии в наших головах», — говорит Лв. «Поэтому мы понимаем, как эффективнее избегать этих пугающих ситуаций, предотвращая столкновения».

Чэнь Лв и его коллеги протестировали свою систему на некоторых сложных дорожных ситуациях, включая незащищенные левые повороты и пересечение оживленного перекрестка без светофора. Они использовали свой конкретный вид нейронной сети, называемый FNI-RL (Fear-Neuro-Inspired Reinforcement Learning), в симуляциях и сравнили его с 10 другими базовыми системами вождения или автономного вождения — в том числе с базовой нейронной моделью интеллектуального водителя, нейросетью имитационного обучения с противодействием и группой лицензированных водителей-людей.

Статистические результаты, полученные водителями-людьми (синие столбцы) и агентами FNI-RL (оранжевые столбцы). (а) Столбчатая диаграмма показывающая долю успешных попыток у водителей-людей и агента FNI-RL. (б) Диаграмма размаха значений обратного времени до столкновения, полученных водителями-людьми и агентом FNI-RL, где время до столкновения рассчитывается от момента перестроения автомобиля, а для неудачных попыток используется небольшая ненулевая константа (0,1 с). (в) Диаграмма размаха среднего абсолютного ускорения эго-автомобиля, где диапазон подсчёта составляет 2 с от момента начала перестроения. (г) Диаграмма размаха среднего абсолютного ускорения заднего автомобиля, где диапазон подсчёта составляет 2 с от момента начала перестроения.

Статистические результаты, полученные водителями-людьми (синие столбцы) и агентами FNI-RL (оранжевые столбцы). (а) Столбчатая диаграмма показывающая долю успешных попыток у водителей-людей и агента FNI-RL. (б) Диаграмма размаха значений обратного времени до столкновения, полученных водителями-людьми и агентом FNI-RL, где время до столкновения рассчитывается от момента перестроения автомобиля, а для неудачных попыток используется небольшая ненулевая константа (0,1 с). (в) Диаграмма размаха среднего абсолютного ускорения эго-автомобиля, где диапазон подсчёта составляет 2 с от момента начала перестроения. (г) Диаграмма размаха среднего абсолютного ускорения заднего автомобиля, где диапазон подсчёта составляет 2 с от момента начала перестроения.

Их результаты показывают, как говорит Лв, что FNI-RL работает гораздо лучше, чем другие агенты ИИ. Например, в одном сценарии вождения на короткое расстояние — поворот налево на перекрестке — FNI-RL демонстрирует улучшения в диапазоне от 1,55 до 18,64 процента в управлении автомобилем по сравнению с другими автономными системами. В другом, более длительном имитированном тесте на вождение на 2400 метров FNI-RL улучшил управление автомобилем до 64 процентов по сравнению с другими автономными системами. Крайне важно, что FNI-RL с большей вероятностью достигал целевой полосы без каких-либо нарушений безопасности, включая столкновения и проезд на красный свет.

Исследователи также провели экспериментальные испытания FNI-RL с 30 водителями-людьми на автосимуляторе по трем различным сценариям (включая другого водителя, внезапно вклинивающегося перед ними). FNI-RL превзошел людей во всех трех сценариях.

Статусы, принятые агентом автономного вождения в сценариях (a)-(b).

Статусы, принятые агентом автономного вождения в сценариях (a)-(b).

Лв отмечает, что это только начальные тесты, и предстоит проделать значительную работу, прежде чем эту систему можно будет, например, предложить автопроизводителю или компании по производству автономных транспортных средств. Он говорит, что его интересует сочетание модели FNI-RL с другими моделями ИИ, которые учитывают временные последовательности, такие как крупные языковые модели, которые могут дополнительно улучшить производительность. «Это может привести к созданию ИИ высокого уровня и более надежному автономному вождению, делая наш транспорт более безопасным, а наш мир — лучше», — говорит он.

Заключение и выводы

Новый подход FNI-RL выглядит весьма многообещающе для развития технологий автопилотов. Система, вдохновленная ответами амигдалы на страх, работает лучше традиционных алгоритмов искусственного интеллекта в компьютерных симуляциях — особенно с точки зрения обеспечения безаварийности. Более того, она не уступает по эффективности даже опытным человекам-водителям!

Однако, при всей впечатляющей результативности в виртуальной среде, адаптация этой системы к реалиям живого дорожного движения требует время. Ясно, что несмотря на обнадеживающие показатели, для практического применения автопилота предстоит ещё немало доработок, поскольку реальная дорожная ситуация подвержена такому не калькулируемому явлению как человеческий фактор.

С другой стороны, способность модели предвидеть различные опасные ситуации и быстро реагировать на них, а также её выносливость, не подверженная человеческим слабостям вроде усталости или рассеянности, все-таки делают FNI-RL важным прорывом на пути к по-настоящему безопасному автономному транспорту будущего.

Такие исследования ещё раз подтверждают потенциал объединения достижений нейронауки и сферы ИИ. И кто знает, может ли новое поколение «нейронных сетей» в скором времени сделать наши автомобили по-настоящему «разумными» помощниками на дорогах!

А что думаете на этот счет вы? Будем рады услышать ваше мнение в комментариях!

Спасибо за прочтение и хорошего вождения!;)

© Habrahabr.ru