AlphaGo выиграл первую игру у Ли Седоля09.03.2016 14:21

ИИ компании Google оказался сильнее одного из лучших игроков в го

Искусственный интеллект может продемонстрировать своё превосходство над человеком в виде выигрыша в логическую игру. Такие игры делятся на те, в которые ИИ уже играет сильнее лучших из людей, и те, которые ещё не поддались. Сегодня в результате первой из пяти игр азиатская игра го стала на шаг ближе к попаданию в первую категорию.
Британская компания по разработкам искусственного интеллекта DeepMind была приобретена Google в 2014 году. DeepMind уже привлекала внимание СМИ разработкой системы DQN, которая самостоятельно научилась играть в 49 старых игр Atari. Последние два года группа сотрудников компании работала над AlphaGo. Это система искусственного интеллекта для игры в го, которая демонстрирует отличные результаты. Добивается она этого с помощью комбинации метода Монте-Карло и нейросетей политики и ценности. Нейросети программы учили на 160 тысячах партий с сервера KGC.

Правила го могут варьироваться, но их основа примерно одинакова. Два игрока размещают камни двух цветов на доске определённого размера, стандартное поле — это 19×19 линий. Цель игры проста: нужно отгородить на доске камнями своего цвета территорию большего, чем соперник, размера.

Го считается трудной для компьютерных систем игрой. Так получается из-за огромного пространства поиска и сложности выбора ходов. Возможных позиций камней на стандартной доске более чем в гугол (10100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Существующие программы умеют играть в го на уровне любителей. Какое-то время считалось, что до появления систем сильнее человека ещё десятилетие.

AlphaGo продемонстрировала, что это не так. Программа легко обыгрывает не только другие продукты, но и человека. Против ИИ сыграл трёхкратный чемпион Европы Фань Хуэй. Результат пяти игр поразил: во всех из них игрок второго профессионального дана уступил компьютерной системе. Позже выбор Google был раскритикован: уровень владения го в Европе не очень высок, а ошибки представителя команды людей вызывали вопросы. Но в Google сразу заявили, что AlphaGo сыграет против легендарного корейского го-профессионала Ли Седоля — лучшего игрока в го за последнее десятилетие, второго по числу титулов. Очевидно, что его уровень игры должен быть выше.

Huge milestone in AI! AlphaGo beats the world champion Lee Sedol! We made history! What an incredible moment! :-) pic.twitter.com/Un4imciEYS
— Mustafa Suleyman (@mustafasuleymn) 9 Март 2016

Сегодня в Сеуле прошла первая из пяти игр. Она привлекла внимание, что неудивительно для Кореи, где в го играют десятки миллионов. Игру посетили два члена корейского парламента и бывший глава Google Эрик Шмидт. Напротив Ли Седоля расположился оператор AlphaGo Аджа Хуань. Кстати, исследователи не сидели на месте после матча против Фань Хуэя в октябре прошлого года и улучшили AlphaGo. Последние пять месяцев ИИ учился в партиях против самого себя.

extremely tense… Lee Sedol is famous for his creative fighting skills, #AlphaGo going toe to toe. Incredibly complicated position…
— Demis Hassabis (@demishassabis) 9 Март 2016

Человек играл чёрными и ходил первым, ИИ — белыми. Разыгранное начало не отличалось особой неожиданностью, даже было немного похоже на сыгранное Фань в Британии. Седоль демонстрировал свой типичный стиль и делал агрессивные ходы. Но и AlphaGo не сдерживалась — система начала наступать примерно через 12 ходов. Как говорят комментаторы, AlphaGo играет подобно человеку: система ищет и создаёт уязвимые группы камней, чтобы сделать сильные ходы. Хотя ИИ сделал несколько ошибок, у чёрных были серьёзные причины для опасений. Игра из 186 ходов на 3,5 часа закончилась тем, что мастер девятого дана признал поражение.

here«s the board from #alphago«s amazing victory over lee se-dol https://t.co/16QOqOL467 pic.twitter.com/4×31ppMDge
— sam byford (@345triangle) 9 Март 2016

Говорить об историческом моменте всё же рано. Последняя пятая игра пройдёт 15 марта. Тогда же определится судьба призового миллиона долларов — или он уйдёт на благотворительность, или его получит игрок-человек. В следующий вторник станет ясно, покорил ли ИИ новую игру или говорить об этом пока рано. Седоль полон решимости: он считает, что открывающие ходы получше позволят достичь больших шансов победы.

Все игры транслируются на YouTube.