[Из песочницы] О барьерах использования знаковых систем в искусственном интеллекте

habr.png

Зачем нам знаковые системы


Знаковая система выступает в роли переносчика мыслей, идей, эмоций, переживаний, ощущений, организации памяти — продуктов психических процессов, протекающий, по представлениям современной науки, в головном мозге человека и высших животных. Знаковая система — это средство указания на такие продукты. Похоже, что в настоящий момент единственный способ передать информацию о результатах работы мышления, памяти, эмоций, ощущений, воображении — закодировать эту информацию с помощью знаковой системы. Мы не можем (пока?) напрямую обмениваться мыслями, эмоциями, ощущениями, не прибегая к той или иной знаковой системе. Нам нужны знаковые системы, чтобы обмениваться результатами таких процессов. Знаковые системы являются спутником обозначенных процессов, а, возможно, существует обратная связь, при которой психические процессы эволюционируют под влиянием знаковых систем, развиваются совместно друг с другом.

По всей видимости, мысль никогда невозможно точно и однозначно выразить только средствами знаковой системы, т.е. кодирование — это аппроксимация, некая модель. Всегда есть возможность уточнить что-то, обозначенное знаком. Не зря существует выражение «подбирать слова» — попытка выразить мысль с помощью знаков. Абсолютно точного и однозначного выражения мысли посредством слов, скорее всего, не существует. Ученый для выражения научных мыслей, идей пишет не одно слово или предложение, а целый ряд статьей, каждая из которых всё ближе и точнее описывает то, что он хотел описать, выразить в своей работе. Ответ на вопрос, тождественен ли знак мысли, эмоции, скорее отрицательный.
Для примера рассмотрим ощущение красного цвета. Если агенты коммуникации знают, что такое красный цвет, имеют соответствующий чувственный опыт, они могут использовать любую подходящую знаковую систему для передачи информации об этом чувственном опыте: произнести слово «красный» или на листе бумаги нарисовать красный круг и показать этот знак друг другу. Если же такого опыта нет, то передать информацию о «красности» невозможно — невозможно рассказать о красном цвете тому, кто не знает, что такое красный цвет. Можно попытаться объяснить, что красный цвет — это электромагнитные колебания с длиной волны около 700 нанометров, но ощущение «красности» от такой информации не появится, знание о том, что такое красный цвет, по-прежнему будет недоступно, т.к. мы не обмениваемся чувственным опытом напрямую — мы обмениваемся знаками, указывающими, включающими, запускающими схожий чувственный опыт у других агентов коммуникации. Т.е. знак — это «обёртка» продукта психического процесса, но не сам продукт.

Барьер понимания


Отсюда вытекает проблема барьера понимания. Современные технологии ИИ довольно успешно решают вопросы, связанные с изучением знаковых систем. Очевидны успехи ИИ в распознавании образов (знаков): письменная речь (OCR), устная речь (Алиса, Siri), музыка (Shazam), изображения; в моделировании естественных языков: выделение частей речи, членов предложения и имен собственных, машинный перевод. Вместе с тем, всё это — примеры изучения и работы со знаковыми системами, не более. Вообще, в изучении знаковых систем человечество постоянно развивается. Возникновение и развитие письменности, науки, культуры, искусства, спорта — всё это тесно связано с изобретением, использованием, изучением и развитием знаковых систем.

Вычислительные возможности, использующие операции со знаками, также растут — начиная с вавилонского абака, изобретённого 3000 лет до н.э., и Паскалины Блеза Паскаля с Арифмометром Лейбница в XVII веке до современной вычислительной техники. И если в вопросах изучения и работы со знаковыми системами прогресс очевиден, то с моделированием психических процессов по-прежнему наблюдаются непреодолимые трудности.

У человека (животных?) знак автоматически увязывается с продуктом мышления, эмоцией и т.п., т.к. он эволюционно и предназначен для кодирования последних. У ИИ нет подобных продуктов, поэтому распознанные знаки ни с чем не увязываются, ничто не кодируют, а остаются как бы сами по себе, остаются просто «голыми» знаками без указания на что-либо вообще, т.е. не несут какой-либо осмысленной или прочувствованной нагрузки, отсутствует понимание распознанного знака. Так, человек, испытавший страх, знает, что это такое, и может об этом попробовать сообщить, т.е. передать и сохранить информацию о своем опыте чувственного переживания, используя владение какой-либо знаковой системой. Например, он может:

  • нарисовать изображение на стене пещеры;
  • написать сочинение на естественном языке;
  • сочинить стихотворение;
  • создать музыкальное произведение;
  • поставить знак смайлика в чате;
  • наконец, вообще ничего не сделать (пустой знак).


ИИ не знает, что такое страх, соответственно, он не может сопоставить страху какой-либо знак вообще. И ощутить какой-либо распознанный знак как страх он тоже не в состоянии. Автопилот под управлением ИИ, наезжая на препятствие на дороге, ничего не поймет, ничего не почувствует, не задумается, не расстроится, не обрадуется, не испугается, не будет никакой рефлексии. Таким образом, для ИИ любой знак ссылается на несуществующий продукт несуществующих у него психических процессов.

Барьер распознавания


Отсюда вытекает еще один барьер — барьер качества распознавания знаков. Под качеством понимается верность, правильность, точность распознавания знака по отношению к эталону. Качество ограничено барьером понимания. ИИ не может оценить качество распознанного образа, т.к. нет обратной связи со стороны мышления и других психических процессов с целью исправления ошибок распознавания. В предложении «ама ыла аму» человек, владеющий русским языком, скорее всего сможет восстановить искажённые знаки-слова.

Например, возможно такое восстановление смысла: «мама мыла раму», т.к. последовательность этих знаков кодируют знакомую шуточную поговорку, которая кодируется набором именно таких слов: «мама мыла раму». Человек смог восстановить неверно распознанные знаки-слова: «ама» → «мама», «ыла» → «мыла», «аму» → «раму». Для ИИ же все три слова в предложении отсутствуют в словаре русского языка. Домысливания, «подгонки» под какой-либо понятный, известный смысл нет, т.к. в памяти ИИ собственно вообще нет никаких сохраненных смыслов. Вместе с тем, если у человека нет знакомых мыслей, кодирующихся похожими словами, слова «ама ыла аму» не увяжутся с какими-либо мыслями, просто потому что их нет, т.е. процессы мышления и кодирования взаимоувязаны и постоянно работают в связке. Видится, что это обусловлено эволюционно — любой встреченный знак должен быть декодирован, «докручен до», «подогнан под» какой-либо известный смысл, т.е. существует автоматическая потребность понять знак, узнать его, увязать с чем-то знакомым и понятным. Существует потребность понять, какую пользу и какой вред несет то, что было закодировано этим знаком. Человек мне улыбается — хорошо, собака на меня лает — плохо. Если не знать, что хорошо, а что плохо, ни улыбка, ни лай не несут никакого смысла. ИИ не знает, что хорошо, а что плохо для него.

При неудачной попытке сопоставить знак смыслу у человека могут возникнуть другие мысли на счёт этого предложения, которые он может выразить, например, такими словами: «я не понимаю, что это, пойду-ка я лучше отсюда», «что бы это могло значить, интересно?», «что за белиберда тут написана?», «возможно, имелось в виду «мама мыла раму», я не уверен, но лучше отвечу так на этот вопрос теста» и т.п. Т.е. в любом случае какой-то по поводу воспринятых знаков вывод будет сделан. Также возможен вариант ложного следа. Например, если источником текста служит электронное средство, где зачастую пренебрегают правилами орфографии, слова «ама» и «аму» могли бы в оригинале быть написаны с прописной буквы — «Ама» и «Аму», т.е. быть именами собственными. Осмысление такого набора знаков уже совсем не было бы связано с поговоркой «мама мыла раму». Можно пофантазировать и предложить такой вариант осмысления — «Ама была Аму» — некто Ама, женского пола, была представителем некоего племени Аму. Отсюда может возникнуть следующая мысль: Ама — это имя из иностранного языка, т.к. мои знания подсказывают мне, что в русском языке нет имени собственного Ама, да и о племени Аму я не слышал. Таким образом, мыслительный процесс раскручивается дальше и дальше, пока не будет сделан какой-либо вывод. Сама по себе правильность или ложность вывода неважна, главное — чтобы вывод был сделан. Вывод может быть верными и неверным, человек может быть прав или ошибаться в своих предположениях. Т.е. неверные, неточные, ошибочные, ложные знаки могут приводить к ложным умозаключениям. На этом основаны развлекательные и интеллектуальные игры, когда по неполной или противоречивой информации предлагается восстановить изначальный смысл. В такую игру мы только что сыграли выше — что было загадано в сообщении «ама ыла аму»: «мама мыла раму» или «Ама была Аму»?

См. также игру в испорченный телефон. Сюда же распознавание изображений — эффект «показалось, померещилось». Сюда же распознавание звуков — эффект «послышалось». Хорошим примером слуховых артефактов служит распознавание слов в тональных языках, например, в китайском. Слово «shi», будучи произнесённым восходящим тоном (обозначим shi2), означает число «десять», а нисходящим тоном (обозначим shi4) — глагол-связку «быть». Местоимение «я» по-китайски произносится как «wo» с нисходяще-восходящим тоном (обозначим wo3). Тогда фраза «wo3 shi4…» для человека, владеющего китайским языком, могла бы обозначать начало предложения «я есть…», «я являюсь…» или просто «я…». В то же время фраза «wo3 shi2…» звучит бессмысленно, т.к. ведёт по ложному следу — слушающий выстраивает мысль «я десять…», что бессмысленно согласно грамматике китайского языка. Но так как мышление пытается придать знакам смысл, оно будет пытаться сопоставить наиболее возможные варианты интерпретации «wo3 shi2…» — «я десять…» с целью получить ожидаемый результат. Например, собеседник может либо додуматься сам, либо переспросить: «ты, наверное, хотел сказать wo3 shi4 вместо wo3 shi2?»

Т.е. будет предпринята попытка восстановить искажённые знаки с целью получения в итоге какого-то адекватного смысла с точки зрения слушающего. ИИ на такое неспособен, т.к. у него нет точки зрения. Продукты работы других органов чувств имеют подобные артефакты распознавания.

Еще раз, у ИИ знаки ни с чем не могут быть увязаны, отсюда барьеры понимания и качества распознавания знаков. Для ИИ слон в обычной городской квартире, оказавшийся там по какой-то причине, обусловленной работой алгоритма распознавания изображений, — нормальная ситуация. Для человека — абсурд, т.к. здравый смысл подсказывает, что даже если слон, пускай это будет слонёнок, смог поместиться в квартире, то совсем непонятно, как он туда попал — дверь квартиры слишком узкая, чтобы он смог войти, грузоподъёмность лифта не соответствует массе слона и прочие ограничения реального мира. Следовательно, слон в комнате на картинке — это либо иллюстрация к сказке, либо фотомонтаж, либо вообще ошибка распознавания образов, т.е. мне показалось, что на картинке изображен слон — вывод сделан. У ИИ нет такого критического мышления, он не может понять смысл, переданный теми знаками, которые он смог распознать, не может исправить ошибку распознавания, не может делать выводы.

Изучение знаковых систем — тупик?


Изучение знаковых систем не позволяет изучать мышление и иные психические процессы, протекающие в головном мозге, непосредственно. Означает ли это, что изучение знаковых систем бессмысленно? Нет, не означает. Знаковые системы — это средство кодирования и передачи наших мыслей, поэтому нам фактически ничего не остается, как изучать первые. Других способов в гуманитарных науках — лингвистике, психологии, социологии и смежных с ними — попросту нет.

Единственную работу, какую мы можем проделывать, чтобы учиться лучше понимать наши мысли, — это изучать знаковые системы. Изучение знаковых систем не отвечает на вопросы структуры и свойств мышления — эти вопросы пока остаются открытыми. Знаки — это указатели на мысли, возможно, даже триггеры мыслей, но не сами мысли, а значит, и изучаем мы только указатели на сущности, но не сами сущности. Изучая знаковые системы, мы изучаем свойства знаковых систем, но не свойства тех сущностей, для кодирования которых данные знаковые системы используются.

Например, изучая лексику и синтаксис русского языка, мы изучаем знаковую систему русского языка, но не сами мысли, которые выражаются с помощью русского языка. Признаемся, сейчас даже непонятно, какова структура, каковы свойства именно у мыслей, а не знаков. Очевидно лишь то, что мысль может быть выражена с определённой степенью точности, приближения с помощью предположительно любой знаковой системы. Например, мысль, которая по-русски выражается словами «грусть», «грустно» может быть выражена с помощью таких знаковых систем:

  • русский язык: предложения «мне грустно», «им грустно» и т.п.;
  • английский язык: предложение «I feel sad», «they look sad» и т.п.;
  • художественное произведение, где будут преобладать холодные тона;
  • музыкальное произведение, где будут преобладать минорные тональности;
  • «грустным» танцем с плавными «печальными» движениями;
  • фотографией грустного лица какого-либо человека или животного;
  • смайлик:-(в современной культуре электронной коммуникации.


Точность передачи этой мысли вышеперечисленными знаковыми системами разная. Способность знаковых систем передавать мысли соответствует потребностям передачи мыслей настолько хорошо, насколько это вообще возможно с учетом возможностей живого организма: органы чувств, окраска, средства передачи танцев, феромоны и т.п. Именно поэтому в естественных языках так много неоднозначностей, неопределённостей и избыточности — всё это служит лишь одной цели — как можно точнее закодировать и передать мысли, эмоции и т.п., даже если для этого требуется введение избыточности и иных неоптимальных с точки зрения объёма передаваемой информации и времени передачи. Люди постоянно уточняют полученную информацию, стараются убедиться, что правильно поняли распознанные знаки, найти в них смысл: переспрашивают фразы, перечитывают тексты, переслушивают музыку, ищут новые смыслы в ранее распознанных знаках.

Парень прочитал в интернете, что девушка поправляет волосы — значит, он ей понравился. Глупо? Возможно, но такова наша природа — сопоставлять знаки со смыслами. Думать, искать решения, чувствовать, распознавать знаки и сопоставлять их смыслам, ставить цели — жить — психические процессы не останавливаются в течение всей жизни. ИИ же дела нет до входной и выходной информации, т.к. её не с чем сопоставить, не к чему привязать.

Знаковые системы несовершенны, но они — единственное, что дала нам эволюция для обмена продуктами психических процессов. Как знать, возможно, природа уже пробовала другие способы передачи, но они оказались неуспешными, и в итоге прижились именно знаковые системы.

© Habrahabr.ru