Исследователи учат робомобили учиться на чужих ошибках

1e147265cd9d7b5ade0f8d2a216adf55.jpg

На конференции по компьютерному зрению и распознаванию закономерностей 2021 года трое исследователей представили свой новый алгоритм обучения автономных средств передвижения. Алгоритм отличается тем, что ИИ учится безопасно водить автомобиль, наблюдая за другими машинами на дороге, пытаясь предсказать, как они отреагируют на их окружение, и используя эту информацию для принятия собственных решений.

Традиционные методы обучения робомобилей подразумевают использование огромного количества данных, описывающих движение автомобилей, по которым нейросеть будет обучаться. Однако исследователи считают, что данных потребуется гораздо меньше, если машины будут обучаться новым навыкам так, как это делают дети — наблюдая за другими и пытаясь повторить.

Мотивацией к данному исследованию послужило желание исследователей увеличить степень обмена данными и кооперации между исследователями данной области. Пока что робомобилям для обучения требуются данные о езде, собранные за много часов –, но обладатели таких данных, крупные автопроизводители, не спешат делиться ими.
По словам одного из инженеров, Эшеда Он-Бара, каждая компания тратит время на одни и те же действия — берёт автомобили, крепит на них датчики, платит водителям за то, что они ездят по дорогам, собирает данные и на их основе обучает ИИ. Если бы компании делились собранными данными, то создать безопасные робомобили получилось бы быстрее — в итоге всё общество выиграло быю.

Он-Бар говорит, что искусственным системам вождения требуется так много данных, что ни одна компания не сможет решить эту задачу самостоятельно. Он считает, что миллиарды накатанных миль — это капля в море по сравнению с событиями, которые могут произойти в реальном мире, и их разнообразием.

Предложенный исследователями алгоритм работает через оценку поля зрения и слепых мест близлежащих машин, строя общий план окружения. Такие карты помогают робомобилям распознавать препятствия, вроде других машин и пешеходов, и понимать, как другие машины могут поворачивать, договариваться друг с другом и уступать друг другу без аварий.

Таким способом робомобили могут переносить действия окружающих машин в свою систему принятия решений. Подобная схема обучения через наблюдение за другими располагает к обмену данными, что в итоге приведёт к появлению более безопасных робомобилей.

Прогнав свой алгоритм по виртуальным городам, в одном из которых применялись простые и понятные повороты и встречались обычные препятствия, а в другом путь состоял из неожиданных препятствий типа перекрёстков из пяти дорог. В обоих случаях количество виртуальных аварий, в которые попадал их ИИ, было минимальным. После всего одного часа обучения робомобили приезжали в точку назначения в 92% случаев.

Среди трудностей, оставшихся на пути алгоритма, исследователи назвали значительные различия между автомобилями, шум, препятствия и проблемы в работе датчиков, разницу в стиле вождения разных водителей.

© Habrahabr.ru