[Перевод] Теперь каждый может стать профессионалом в машинном обучении30.09.2016 13:52

Марк Хэммонд в штаб-квартире Bonsai в пригороде Беркли

Вы успешно играете в футбол, снимаетесь в популярном кино, или удачливо играете на бирже? Поздравляю — вы почти так же ценны, как специалист по обработке данных или по машинному обучению с докторской степенью из Стэнфорда, MIT или Карнеги-Меллон. По крайней мере, всё выглядит именно так. Все компании в Кремниевой долине –, а в принципе, уже и не только там — лихорадочно соревнуются, чтобы получить такой приз-человека. Это нечто вроде охоты на трюфели в исполнении менеджеров по персоналу. По мере того, как предприятия понимают, что их соперники полагаются на искусственный интеллект (ИИ) и машинное обучение (МО), количество вакансий для этих специалистов будет постоянно повышаться.

Но что, если вы могли бы получить преимущества ИИ без найма дорогих и талантливых специалистов? Что, если умный софт понизит планочку? Можно ли получить преимущества глубокого обучения (ГО) без особых талантов?
Стартап Bonsai [Bonsai] — одна из компаний, положительно отвечающих на этот вопрос. С их помощью, возможно, грядёт демократизация ИИ, которая в результате может коснуться миллионов, если не миллиардов, людей.

Сегодня на конференции O«Reilly по ИИ в Нью-Йорке, гендир Bonsai, Марк Хэммонд [Mark Hammond] покажет демонстрацию работы системы. В демке воспроизводится одно из знаковых достижений ГО: как система DeepMind научилась играть в старые игрушки от Atari. Конкретно, программа Bonsai будет учиться играть в Breakout, где платформа отбивает мячик, уничтожающий стенку из кирпичей (игра от 1976 года стала в своё время прорывной — кстати, над ней работал Стив Джобс).

37 строк кода создают нейросеть, обучающуюся играть самостоятельно

При этом DeepMind создавали гении ИИ мирового класса, и тренировали нейросеть на наборе игр от Atari. Такое достижение удостоилось публикации в журнале мирового класса. В случае с Bonsai это скорее способ срезать путь. Он начинается с системы разработки, находящейся в облаке. Один программист, может быть даже, никогда не посещавший курсы по ИИ в колледже или в интернете, может описать игру, и система сама выберет наиболее оптимальный алгоритм для обучения нейросети. Затем программист за несколько минут кодирует концепцию игры — к примеру, необходимость держать платформу под мячиком — и предоставляет Bonsai возможность самостоятельно работать с нейросетями, оптимизируя их для наилучшего результата.

Версия игры от Bonsai занимает 37 строк кода. Но это обманчиво. Когда Хэммонд показывает, что творится «под капотом» системы, он демонстрирует график, отображающий, как система строит сложную нейросеть, достойную одного из «ниндзя», занимающихся МО в Google. Программисту не придётся иметь дела со всем этим МО-добром.

Трюк удивительный. «Меня обычно не очень впечатляют демки,- говорит Джордж Уильямс [George Williams], исследователь из Курантовского института математических наук при Нью-Йоркском университете. — Но то, что показывал мне Марк, было как правдоподобным, так и просто удивительным. Он понял наше текущее состояние с МО и инструментами, необходимыми для создания ИИ следующего поколения».

Станет ли Bonsai лидером этого направления, пока неизвестно. Но Уильямс прав насчёт того, «где мы находимся» на шкале развития ИИ. Следующий шаг — появление и расцвет умных компьютеров с МО для «чайников».

Bonsai родился на пляже. Хэммонд, ранее работавший в Microsoft разработчиком, уже некоторое время интересовался ИИ. После ухода из компании в 2004 году, он работал в Йельском университете в области неврологии. В 2010-м некоторое время провёл в ИИ-стартапе Numenta под руководством Джеффа Хокинса (сооснователя карманного компьютера Palm), но ушёл, чтобы запустить стороннюю компанию, которую впоследствии продал.

Затем в 2012 году Хэммонд был в гостях у друзей на юге Калифорнии. Его карапуз-сын устал, и вся компания возвращалась в машину. Пока жена Хэммонда болтала с друзьями, а сын засыпал на руках, он провёл мысленный эксперимент. Он начался с популярного в мире ИИ мема — концепции «главного алгоритма». Как предположил профессор Педро Домингос из Вашингтонского университета (в одноимённой книге), эта ещё не открытая технология МО будет универсальным решением для всех проблем. Когда учёные выведут этот алгоритм, мы сможем применять ИИ к чему угодно.

Но Хэммонд обнаружил недостаток в этих рассуждениях. Допустим, мы обнаружим такой алгоритм. Кто его будет приспосабливать к бесчисленным практическим применениям? Сегодня на такое способны только адепты МО. Их слишком мало, а задач слишком много. Нам нужна система, которая опустит планку настолько, чтобы обычный разработчик мог применять эти инструменты. Такая система не потребует узкой специализации по МО для тренировки нейросетей, но позволит программистам учить систему для выдачи нужных результатов.

Постепенно он провёл аналогию с историей программирования. Изначально необходимо было писать программы в машинном коде. Затем программисты разработали стандартный набор инструкций, ассемблер. Прорыв произошёл с разработкой компилятора, переводившего языки высокого уровня в ассемблер. И после этого программирование начало позволять новичкам создавать серьёзные программы. Хэммонд считает, что такие инструменты, как TensorFlow от Google, напоминают ассемблерную эру. Они облегчают построение нейросетей, но всё же вход в эту область доступен тем, кто хорошо разбирается в работе нейросетей. Он захотел создать нечто вроде компилятора, чтобы расширить этот вход.

Он поделился идеей с Кином Брауном [Keen Browne], бывшим коллегой из Microsoft, недавно продавшим свой игровой стартам китайцам. Тому понравилась идея, поскольку он сам пытался постичь глубокое обучение с использованием доступных популярных средств. «Я довольно умён,- говорит он. — Я был в Китае, выучил их язык. Я программировал в Microsoft. Но это занятие оказалось смехотворным». И он подписался на сооснование Bonsai. Такое имя выбрано потому, что японские растения, искусственно выведенные, соблюдают баланс между естественным и искусственным. В качестве бонуса удалось зарегистрировать домен bons.ai.

Bonsai — не единственный стартап, пытающийся решить проблему нехватки специалистов по ИИ. Некоторые компании занялись тренировками своих собственных сотрудников по части нейросетей. В Google разработан целый набор внутренних курсов, и Apple разыскивает программистов с такими навыками, которые бы позволили им обучиться нужной теме без проблем. Также Google выпустил в свет программу TensorFlow, помогающую их инженерам строить нейросети. Существуют и другие инструменты для работы с ИИ, а за ними наверняка последует ещё больше, с разной необходимой степенью понимания вопроса.

Есть и другие стартапы, занимающиеся демократизацией ИИ. Компания Bottlenose обращается к другой аудитории, нежели Bonsai: они работают не для программистов, а для бизнес-аналитиков. Но посыл знакомый. «Мы даём новые возможности пользователям, не являющимся учёными или программистами»,- говорит гендир компании, Нова Спивак [Nova Spivack]. Другие стартапы берут ещё шире: на конференции глава компании Clarifai делал доклад «Как позволить любому человеку натренировать и использовать ИИ».

Так что, хотя вроде бы Bonsai вовремя нашёл себе хорошую нишу, из-за бурной активности в этой области привлечь внимание к себе будет трудно. Адам Чейер, эксперт по ИИ, один из создателей Siri, и главный программист в Viv, впечатлён продуктом стартапа. Но он отмечает, что хотя Bonsai делает ИИ ближе к новичкам, им всё равно придётся напрячь мозг и изучить его язык программирования и работу системы. «Когда большие компании вроде Google выкатывают систему, люди с ног сбиваются, чтобы разобраться в ней,- говорит он. — Но стартапу не так-то просто заинтересовать людей. Хватит ли у них сил заполучить достаточно пользователей для того, чтобы стать популярными?»

По словам Хэммонда, построение нейросетей при помощи Bonsai отличается от того, как это делают профессионалы, в ключевых моментах. Сейчас для решения конкретной задачи необходимо подбирать правильные инструменты, что требует опыта и знаний. А Bonsai должен будет делать это сам. Вам нужно лишь описать концепции того, чему вы хотите обучить систему.

И пока опытные специалисты будут учить сети, сравнивая их выдачу с желаемыми результатами, Bonsai позволит вам учить систему, разбивая процесс на концепции. К примеру, если вы хотите, чтобы система распознавала фото собак, вы можете охарактеризовать собаку, как имеющую четыре ноги, длинную морду, длинный свисающий из пасти язык. Вы подталкиваете систему, и «интеллектуальный центр» в облаке сам во всём разбирается.

Тут есть свои плюсы. Учёные часто не понимают, как натренированные сети выполняют свою работу, поскольку они сами себя настраивают и организовывают все концепции непонятным образом. Но в Bonsai описываемые пользователем концепции дают нам карту мышления нейросети. «Программа не должна быть чёрным ящиком»,- говорит Хэммонд. К примеру, если вы программируете робомобиль, и машина не нажмёт вовремя на тормоз, нужно иметь возможность разобраться, что думала ваша система в тот момент.

Вопрос в том, не приведёт ли такая абстракция к падению быстродействия и эффективности. Обычно с компиляторами так и бывает — программы работают не так быстро, как те, что написаны на ассемблере. Сомнение вызывает и способность системы выбирать правильные инструменты для решения задач не хуже докторов наук, которых она должна заменить.

«Думаю, компромиссов не избежать»,- говорит Лила Третиков [Lila Tretikov], специалист по ИИ, ранее работавшая в Wikimedia Foundation, и консультировавшая Bonsai. «Это не совсем то же самое, что иметь под рукой команду из докторов наук. Но что важнее — бескомпромиссность или просто возможность сделать то, что необходимо?». Адам Чейер из Viv считает, что Bonsai может работать не так эффективно, как оптимизированная под конкретную задачу система. «Но код её хорош, и она позволяет вам находиться на верхнем уровне абстракции»,- говорит он. Чейер говорит, что в его компании есть несколько ценных специалистов по ИИ, и поэтому они вряд ли будут использовать Bonsai — разве что, как инструмент для прототипирования.

Bonsai пробует свои силы на задачах, которые пока не решены и классическими системами с ИИ. «Мы работаем над разными играми»,- говорит Хэммонд, поясняя, что игры служат ключами к нескольким главным проблемам, к которым Bonsai планирует подступиться. «Определённые классы игр ИИ пока не раскусил, даже DeepMind. Они натренировались на куче игр кроме Breakout, но, например, им так и не удалось заставить систему удачно сыграть в Pac-Man».

Но главное в том, как Bonsai вливается в движение по передаче ИИ в руки людей, не обладающих большими знаниями в этом вопросе. Можно ожидать, что множество инструментов высокого уровня будут становиться мощнее и повсеместно распространяться. Дойдём ли мы до точки, в которой каждый человек на планете тренирует и использует ИИ? По крайней мере, на это ставят множество умных людей с деньгами.

«В облаке у нас есть аналитики»,- говорит Спивак, гендир Bottlenose. Он говорит, что этих виртуальных консультантов можно вызывать с вопросами вроде «в какой колледж мне пойти». Стоимость работы системы номинальная, а может и нулевая. «Не будет возможности оправдаться в плохом решении тем, что вы не можете позволить себе ИИ»,- говорит он.

Может, мы доберёмся даже до такого состояния, когда ИИ успешно покорит Pac-Man. Bonsai пока не справился с этим. «Мы работаем над этим,- говорит Хэммонд. — Пока анонсов по этому вопросу нет».