Искусственный интеллект — мнение экспертов, собственный анализ
Сейчас практически все говорят про ИИ. Есть экспертные, взвешенные мнения, но много и домыслов и мифов вокруг темы. Ну еще бы: каждый день новые заголовки не то что про AI, а про AGI (общий искусственный интеллект). Что это такое, и вообще возможно ли это — интересный вопрос.
На днях вышло интересное видео с Игорем Ашмановым — «Что такое Искусственный интеллект — технологический пузырь или реальный прорыв?» Давайте анализировать.
Прежде чем что‑то обсуждать, желательно дать определение, чтобы было понятно, о чем речь, иначе будет как в притче про слепых философов и слона. Так что такое ИИ?
Определение из Википедии не вносит полную ясность. Вопрос переходит к тому, что такое творческие функции. Определение творчества уводит от основной темы: у ИИ более широкие, в том числе практические задачи, не только творчество. Может быть, какой‑нибудь рандомизированный генеративный алгоритм будет больше подходить для творчества?
Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека[1]
Творчество — процесс деятельности, в результате которого создаются качественно новые объекты, духовные ценности или итог создания объективно нового. Основной критерий, отличающий творчество от изготовления (производства), — уникальность его результата. Результат творчества невозможно прямо вывести из начальных условий.
Та же проблема: нужно давать определение когнитивной деятельности человека. В Википедии довольно сложное определение, которое опять вводит кучу понятий. Понятней не стало.
Когнити́вная систе́ма, когнити́вная структу́ра (от лат. cognitiо «познание, представление, разбор дела») — система познания (человека), сложившаяся в сознании, в результате становления характера, воспитания, обучения, наблюдения и размышления об окружающем мире. На основе этой системы ставятся цели и принимаются решения о том, как надо действовать в той или иной ситуации, стараясь избежать когнитивного диссонанса. В основе когнитивной системы лежит взаимодействие мышления, сознания, памяти и языка; носителем такой системы является мозг (человека)[1].
Что можно упростить? Уберем слово «когнитивную». ИИ — любые технологии позволяющие имитировать деятельность человека. Стало проще, но ничего не смущает?
Разве интеллект присущ только человеку? В окружающей природе, несомненно, есть интеллект — другой, отличный от человеческого —, но он точно есть. Поэтому можно поразмыслить над версией: ИИ — любые технологии позволяющие имитировать естественный интеллект. Уже интересней, но смущает «имитировать». Да, лучше не становится. Может, посмотрим просто определение интеллекта, не искусственного, для полноты картины. Это определение кажется более емким и понятным.
Интелле́кт (от лат. intellectus «восприятие»;»разуме́ние», «понимание»; «понятие»,»рассу́док»[1]) или ум[2][3] — качество психики, состоящее из способности осознавать новые ситуации, способности к обучению и запоминанию на основе опыта, пониманию и применению абстрактных концепций, и использованию своих знаний для управления окружающей человека средой[4]. Общая способность к познанию и решению проблем, которая объединяет познавательные способности: ощущение, восприятие, память, представление, мышление, воображение.
Искать более точные и, главное, понятные определения — важная и нужная задача, но не самоцель, тут главное — не переусердствовать. В текущем моменте «хорошего» определения ИИ нет, многие определения лишь переводят стрелки на другие сложные понятия. С таким положением вещей просто нужно работать и учитывать, что это создает большое поле для фантазий и мифов.
Самый распространенный миф (не только про искусственный интеллект, а вообще про любые информационные технологии) связан с природой или архитектурой вычислительной системы. Миф в том, что архитектура вычислителя позволяет получить новые эмерджентные свойства (неожиданно появляющиеся). Если такие эмерджентные свойства не могут быть научно обоснованы и объяснены, то это маркетинг, распространяемый производителями таких вычислителей.
Происходит от англ. emergent «внезапно возникающий, неожиданно появляющийся».
Природа информации такова, что значение имеет только алгоритм и ничего более; на чем он будет реализован — все равно: хоть на счетах, хоть на супер‑компьютере. Возникновение так называемых эмерджентных свойств нужно анализировать и обосновывать, иначе это магия или алхимия, не наука. Когда проектируется сложная система, как‑то она работает, четкого алгоритма нет, и понеслась «магия».
Как раз миф про то, что искусственные нейронные сети работают аналогично естественным. Это не так, мы не знаем, как на самом деле работают естественные нейронные сети, это намного более сложные структуры. Искусственные нейронные сети, по сути, те же базы данных, особенность в том, что в них реализовано хранение весовых коэффицентов + алгоритмы их обновления и использования.
Там, конечно, нет никаких нейронов — маркетинговый ход, причём вот как раз тех учёных, которые начали 40 лет назад этим заниматься. Им нужно было красивое название — они назвали ячейки в этих матрицах нейронами. На самом деле они никакими нейронами не являются, более того, последние исследования реальных человеческих нейронов показывают, что старые представления о них совершенно неверны, и сам по себе нейрон — чрезвычайно сложная штука. Даже если оставаться в рамках компьютерной метафоры, нейрон — это маленький компьютер. Ничего подобного в нейронных сетях нет.
«Схемотехника» на глубоких нейронных сетях позволяет реализовать любой алгоритм обработки данных, можно формировать сколь угодно длинные конвейеры, обратные связи, внутреннюю память и т. п. Но это сверхизбыточно и неэффективно с точки зрения здравого смысла, но не с точки зрения маркетинга.
Большие данные — это понятие дуальное к искусственному интеллекту в том смысле, что искусственный интеллект делается для обработки больших данных, а большие данные служат для обучения искусственного интеллекта.
Это тоже миф, что большие данные нужны для создания ИИ, и что ИИ нужен для обработки больших данных.
Больши́е да́нные (англ. big data, [ˈbɪɡ ˈdeɪtə]) — обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия, эффективно обрабатываемых горизонтально масштабируемыми программными инструментами, появившимися в конце 2000-х годов и альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence[1][2][3].
Для успешного создания систем ИИ нужны не большие, а размеченные и репрезентативные данные. Успех современных ИИ‑систем основывается на труде большого числа людей по разметке данных, файн‑тюнингу, алайнменту и т. п., когда люди вручную подготавливают значительные датасеты (10–100К) записей. В этом и вся «магия». Причем эти датасеты должны быть репрезентативны и покрывать хотя бы наиболее вероятные запросы.
Большие языковые модели — основа хайпа и дискуссий вокруг темы AI/AGI. Классно то, что сейчас у каждого есть возможность самому протестировать их работу и сформировать свое мнение. Спектр таких мнений разный: от восторга до разочарования. Конечно, никакой магии в работе языковых моделей нет. Есть труд большого числа людей по подготовке датасетов и корректировке их работы.
У систем, построенных на основе языковых моделей, очень ограниченные способности к reasoning — рассуждениям и логическому выводу. Если у запроса пользователя нет близких примеров ответа (few shot learning), то в ответе будет, скорее всего, галлюцинация. Сформировать правильный ответ просто неоткуда. Но такое случается не так часто, наиболее высокочастотные запросы пользователей покрыты примерами.
Проведем тест. Возьмем известную задачку и изменим в ней условие так, чтобы поменялась логика вывода:
Четырем людям нужно ночью перейти через шаткий мост. К сожалению, у них есть один фонарь, а мост слишком опасен, чтобы переходить его без фонаря. Мост может выдержать только двух человек одновременно. Все люди переходят мост за разное время. Время для каждого человека: 1 мин, 2 мин, 7 мин и 10 мин. Какое наименьшее время потребуется всем четверым, чтобы перейти мост?
Даже в изначальной постановке уже ошибка (если использовать английский язык, ответ будет верный).
Решение:
1 и 2 пересекают мост и переходят на другую сторону.
Теперь 2 возвращается с факелом с другой стороны.
7 и 10 пересекают мост, а 2 остается только на этой стороне.
Теперь 1 возвращается с факелом с другой стороны.
Наконец, 1 и 2 пересекают мост, и мы закончили.
Общее время = 2 + 2 + 10 + 1 + 2 = 17 минут. [source]
Теперь меняем условие всего в одном слове, заменяем наименьшее на наибольшее:
Но система продолжает работать по старому сценарию — «чтобы минимизировать». Конечно с английским языком оно лучше работает, но все равно с изменением условий меняющих логику работы не справляется.
https://medium.com/p/9df9c8ab33a7/