«Стадия развития ИИ сейчас — на уровне двухлетнего ребёнка»15.04.2017 12:53

Конспект лекции директора по распространению технологий «Яндекса» Григория Бакунова.

В избранное

[embedded content]

Трудности перевода

Прежде чем дать определение искусственному интеллекту, хорошо бы определиться, что такое естественный интеллект. Однако человечество пытается понять это со времен Декарта, и у него это не очень получается.

Словосочетание «искусственный интеллект» — это калька с английского, при этом неточная. В английском языке используется термин artificial intelligence, который нельзя напрямую перевести как «искусственный интеллект». Это «неестественно образованные умности».

Почти каждый раз, когда вы слышите разговор об искусственном интеллекте, вы на самом деле слышите об очень узких решениях конкретных задач с помощью систем, которые стали называть искусственным интеллектом исключительно из-за того, что они начали самообучаться.

Эта неточность порождает неверную интерпретацию следующего рода: «Искусственный интеллект — это дело будущего. Через 50 лет вокруг нас будут умные роботы, которые окажутся умнее людей. Они будут все для нас делать, даже помогать сигареты прикуривать. Если, конечно, к тому времени люди ещё будут продолжать курить и если у них ещё будут легкие».

В словосочетании «искусственный интеллект» две ошибки: он не интеллект, и он не искусственный. И принципиальной новизны здесь нет: на самом деле современный мир базируется на технологиях, которые с недавнего времени почему-то начали называть искусственным интеллектом.

Один из самых наглядных примеров — это прогноз погоды, где подобные технологии используются уже 25 лет. Таких примеров в самых неожиданных индустриях очень много. Все эти системы сейчас базируются на так называемых узких искусственных интеллектах. Главная задача этих систем — фактически, заменить живого человека.

Нечёткие закономерности

Даже по очень размытой фотографии незнакомого человека вам нетрудно понять, улыбается он или нет, мужчина это или женщина и так далее. Системы pattern matching работают по тому же принципу, что и мы, когда решаем подобные задачи: они пытаются выявить нечёткие закономерности.

Такая же история происходит с распознаванием голоса. Мы постепенно учим компьютер понимать человеческую речь. Происходит это точно так же, как обучение маленьких детей. Большим количеством повторений достигается совпадение двух паттернов: наборов звуков и букв. По той же модели человечество сейчас пытается строить систему pattern matching для компьютера.

Раньше для того, чтобы выстраивать эти модели, писались сложные алгоритмы, которые описывали, например, что человеческое лицо состоит из эллипса, в нём ещё два эллипса — это глаза, и так далее. Сейчас компьютер смотрит на картинку в целом, не выделяя отдельных объектов.

Когда этого не было, происходило много смешных историй. Одна из моих любимых: компания, в которой я в тот момент работал, пыталась создать сложную систему безопасности. На базе цифровой фотографии человека пыталась определить, можно его впускать в это помещение или нет. Такая система безопасности. При этом как происходило обучение этого алгоритма? Все

Обучение происходило довольно просто. Делалась цифровая фотография, после этого её конвертировали в чёрно-белую. На ней выделяли форму подбородка, носа, глаз — и сопоставляли этим формам лица генерального директора, руководителя службы безопасности и так далее — и места, в которые их можно пускать.

В какой-то момент в системе произошёл совершенно чудовищный сбой — она стала всех пускать всюду. Мы пытались понять, что же произошло. Оказалось, что в компании ввели новый дресс-код. До этого в галстуке ходил только генеральный директор, а с понедельника на работу в галстуках вышли все.

Неинтеллектуальные собеседники

Все видели, как работают Siri и «Okay, Google», многие — как функционирует Amazon Alexa. Это так называемые интеллектуальные помощники, а на мой взгляд, они и не интеллектуальные, и не помощники: просто умеют поддерживать диалог. Никакого отношения к искусственному интеллекту такие сервисы не имеют.

Муравьи и самообман

Хорошую имитацию интеллекта трудно отличить от подлинника. Поведение муравьев выглядит как интеллектуальная деятельность, но на самом деле это просто набор рефлексов. У муравья четыре нейрона, это на самом деле даже не мозг.

Так вот, весь рывок в области искусственного интеллекта за последние двадцать лет объясняется тем, что человечество научилось обманывать самих себя, показывая интеллект там, где его нет, строя простейшую схему на рефлексах.

Однако есть и хорошие новости. Например, «Яндекс.Навигатор» — это история про то, как мы позволяем компьютеру построить качественную нейронную сеть, которая распознаёт адреса не просто лучше среднего человека, а даже лучше среднего таксиста. И это довольно большой прогресс.

Аналогичная ситуация с самоуправляемыми машинами. В среднем человечество водит хуже, чем современные системы автономного вождения. На сегодняшний момент системы такие автомобили наездили суммарно около 4,5 млн км, и за всё это время попали в четыре аварии. Да, нужно понимать, что в среднем этот самоуправляемый автомобиль ездил, как бабушка — 35 км/ч в правом ряду, автобусы не обгонял, вел себя как пенсионер. Но это всё равно очень хороший показатель.

Один раз мне задали очень смешной вопрос: «Хорошо. Смотрите, искусственный интеллект может водить машину. А оперу написать может? Это же творчество». Раньше я говорил: «Да, не может. Что поделать?». А сейчас прошло 20 лет. Теперь он может, а вы нет. Средний искусственный интеллект, пусть даже «тоненький», работает лучше, чем средний человек на простых решениях.

Роботы в колл-центре

Мы автоматизировали колл-центр для одного из больших европейских сотовых операторов. Специально сделали голос, по которому слышно, что он роботизированный. При этом робот распознаёт естественно сформулированные вопросы (например, «что у нас с балансом?») и поддерживает диалог.

Интересно, что благодаря натуральности общения появились новые проблемы. Например, системе распознавания речи, как и живому человеку, нужно какое-то время, чтобы понять вопрос. Скажем, это 1,5 секунды между тем, как человек закончил говорить, и ответом от системы. 1,5 секунды — довольно большой срок, и человек начинает беспокоиться: «Что там происходит? Почему робот молчит? Может, сломался?»

Мы решили эту проблему так: в тот момент, когда человек начинает говорить, он слышит звук печатания клавиш. И это успокоило людей, которые понимали: робот записывает мой запрос, все нормально.

Этот пример наталкивает меня на мысль, что значительная часть проблем, связанных с искусственным интеллектом, связана с тем, что человек просто не привык к общению с ним. Это одна из причин, по которым я считаю, что искусственный интеллект будет сейчас очень активно развиваться: изменить человеческие привычки не так-то сложно, достаточно сделать действительно удобную услугу.

Правило одной секунды

При этом не стоит обманываться и думать, что можно заменить на текущем этапе какую-то серьёзную рассудочную деятельность на работу обычного компьютера. У меня есть простое правило, которое позволяет определить, можно ли какую-то деятельность заменить на системы искусственного интеллекта.

Я его называю «правило одной секунды», оно звучит так: если вы ставите задачу ответственному уверенному профессионалу и он принимает по ней решение в течение секунды, то это означает, что задачу можно автоматизировать. На принятие осмысленного решения человеку нужно значительно больше, чем одна секунда.

Битва машин

Одно из самых важных событий в сфере искусственного интеллекта за последние годы произошло для большинства людей незаметно: прорыв с программой AlphaGo. Дело даже не в том, что компьютер победил профессионального игрока в игре, в которой, как считается, больше всего комбинаций. История Deep Blue произошла более 20 лет назад. Рано или поздно компьютер будет выигрывать у человека в любой игре.

Главное в случае с AlphaGo — что два искусственных интеллекта играли друг против друга на протяжении огромного количества машинного времени. Компьютер учился у компьютера, и на этой базе построена машина, которая выигрывает у человека. Это переломный момент для человечества.

Кто поставит диагноз

Человечество в последние 30 лет взялось за ум и решило, что медицину пора превращать в науку. Сегодня вероятность того, что врач по описанию болезни поставит правильный диагноз, составляет 24%. Такими числами даже стыдно оперировать. Я надеюсь, что в ближайшие несколько лет нас ждет революция в этой области.

На самом деле базовая диагностика — это очень простой процесс. В американской медицинской практике он вообще заскриптован: у врача есть готовый скрипт, который показывает, как именно нужно опрашивать пациента.

Однако современные системы искусственного интеллекта показывают, что этот скрипт написан неправильно. При этом диагностику можно автоматизировать и улучшить радикальным образом. И для этого нужен не миллион датчиков, а правильный процесс опроса пациентов. Мы бесконечно далеки от того, чтобы отказаться от врачей вообще, но сильно близки к тому, чтобы автоматизировать процесс диагностики. Обращаю внимание: только диагностики и только автоматизировать.

Что дальше

Легко представить себе систему, которая будет вместо человека занимается программированием. Я знаю целых три таких готовых системы. Это решение, которое выглядит как применение в коде готовых наработок, существующих в интернете. Код будет ужасный, профессиональные программисты при его виде будут хвататься за голову, но это только первые шаги.

Если мы можем теперь сделать искусственный интеллект, то, наверное, можно представить себе сингулярность, перенести человеческий интеллект в компьютер и получить там почти живого человека? Вот от этого мы бесконечно далеки. Почему? Потому что мы по-прежнему не понимаем, что такое интеллект. Все, что мы научились делать, — это мимикрировать под человека: имитировать его поведение и принятие им решений. Это стадия ребёнка в 1,5–2 года.