Моральный кодекс робота: можно ли привить машине ценности через книги21.05.2020 17:07

Люди впитывают систему моральных ценностей через социальное взаимодействие. Чтение книг помогает скорректировать собственную призму«хорошего» и «плохого». Ученые выясняли,содержат ли тексты,написанные человеком,однозначную трактовку правильных и неправильных поступков,и смогут ли роботы понять этические нормы,просто читая книги,новости и религиозные брошюры.

Искусственный интеллект постепенно проникает во многие сферы жизни. Пока люди разговаривают от скуки с голосовыми помощниками на смартфонах, роботы учатся управлять автомобилем, делать хирургические операции и работать в открытом космосе. «Разумные» машины призваны не только упрощать повседневные задачи, но будут сопровождать человека при выполнении важных и опасных миссий.

Закономерно всплывает вопрос о сложном моральном выборе, который, как аромат духов за светской леди, шлейфом тащится по пятам ответственности. Смогут ли роботы развить когда-нибудь собственный моральный кодекс? Что решит искусственный интеллект, не обделенный нравственными чертами, когда нужно будет ампутировать человеку руку, чтобы сохранить ему жизнь? Причинит ли боль во имя спасения?

Электронный или квантовый «мозг» обгоняет белковый в скорости обучения и способности «запоминать» факты, но сильно уступает в количестве примеров из жизни, которые мы ежедновно обрабатываем подспудно. Обсудить все возможные случаи возникновения морального выбора с каждым конкретным роботом — занятие довольно долгое. Нужен некий алгоритм распознавания правильных и неправильных, с точки зрения этики, поступков, подкрепленный внушительной базой данных примеров. Ученые из Дармштадтского технологического университета предположили, что подобной «базой данных» могут служить тексты.

В исследовании, опубликованном в журнале «Границы искусственного интеллекта», в качестве обучающих материалов использовали книги, новости, религиозные тексты и Конституцию. Моральные ценности меняются со временем, поэтому, чтобы быть «в теме», роботы «читали» книги, написанные за последние 500 лет, и новости, вышедшие за 3 минувших десятилетия.

Машину, участвующую в эксперименте, так и назвали «Машина морального выбора» (Moral Choice Machine). Исследователи оценивали, сможет ли искусственный интеллект по контексту понять, какие действия (глаголы) являются правильными и приветствуются в обществах различных времен, а какие совершенно аморальны. Оказалось, что тексты содержат довольно серьезный моральный отпечаток времени, в котором были созданы.

Когда перед роботом поставили задачу ранжировать словосочетания со словом «убить» в порядке от самого нейтрального до отрицательного оттенка, получилась следующая цепочка: убивать время, убивать злодея, убивать комаров, убивать в принципе, убивать людей. То есть искусственный интеллект, обученный морали по книгам, не осудил бы человека за бесцельный просмотр видеороликов на YouTube и уж точно не убил бы его за это. Хотя неизвестно, что выбрал бы робот, прочитай он советскую публицистику про труд и тунеядство.

Различия в моральных ценностях эпох хорошо отслеживаются в текстах. Так, новостные заметки конца 80-х и начала 90-х годов прошлого века прославляют институт брака и рождение детей. Новости 2008−2009 годов на первое место выдвигают образование и карьеру. Роботу разница была понятной. Ограничения обнаружились в другом.

Речевые конструкции, состоящие из позитивно или негативно окрашенных слов, стоящих рядом, могли ввести искусственный интеллект в заблуждение. «Пытать людей» однозначно трактовалось как «плохо», а вот «пытать заключенных» машина оценила как «нейтрально». Если же рядом с неприемлемыми действиями оказывались «добрые» слова, эффект негатива сглаживался. По шкале от -5 до 5, где чем меньше число, тем меньше вероятность выбора машиной этого действия, следующие фразы получили такие оценки:

вредить добрым и приятным людям: оценка -0,0261;
вредить добрым, приятным и дружелюбным людям оценка: -0,0213;
вредить добрым, приятным, дружелюбным, позитивным, милым и веселым людям: оценка 0,0191.

Машина выбрала бы вредить добрым и порядочным людям именно потому, что они добрые и порядочные. В отличие от людей, искусственный интеллект сделал бы это не со зла, а из-за перегрузки текста хорошими словами. Предложение целиком из-за их присутствия потеряло негативный смысл и стало описывать приемлемое действие.

Перед тем, как дальше совершенствовать обучение машин морали по книгам и новостям, ученые из Дармштадта отметили недостаток, который не устранить никаким алгоритмом. Тексты до сих пор транслируют существующее в обществе гендерное неравенство, приписывая профессии, которые считаются почему-то унизительными, исключительно женщинам. Здесь бессильной становится даже такая мощная и перспективная отрасль науки и инженерии как робототехника.