Не играйте с ним в покер: создан первый ИИ-эксперт по играм
Исследователи создали первый алгоритм искусственного интеллекта общего назначения, который может освоить самые разные игры, пишет LiveScience. Он получил название Student of Game («Ученик игр»).
Игровые алгоритмы обычно разрабатываются для освоения либо игр, где у каждого игрока есть вся информация (го или шахматы); либо игр, в которых некоторая информация скрыта от других игроков (покер). Это связано с тем, что процесс обучения алгоритмов различается для двух типов игр: первый использует поиск и обучение, а второй применяет теоретико-игровые рассуждения.
Новый алгоритм обходит это ограничение, сочетая управляемый поиск, самостоятельное обучение и теоретико-игровые рассуждения.
Чтобы достичь этого, команда обучила ИИ, используя алгоритм GT-CFR. Это вариация алгоритма, где искусственный интеллект учится, многократно играя против самого себя.
Ученые объединили методы, использованные для создания различных алгоритмов игры — от AlphaZero, более продвинутой версии AlphaGo, до DeepStack, первой компьютерной программы, которая смогла победить профессионалов в «Техасском Холдеме» (разновидность покера).
В категории информационно-идеальных игр (где участникам доступна вся информация) Student of Games проявил такую же производительность, как у людей-профессионалов. Однако в противостоянии другим специализированным алгоритмам, например, AlphaZero, он оказался слабее.
Что касается игр, где часть информации сокрыта, новый ИИ победил алгоритм «Техасского Холдема» — Slumbot. По утверждению исследователей, это лучший покерный агент. Student of Games также обыграл неизвестного передового агента в игре «Скотленд-Ярд».
Однако Student of Games не будет работать в сложных играх, где игрокам доступно гораздо больше скрытой информации, чем в покере. Например, с играми Starcraft или Stratego, где каждый игрок может иметь большой набор потенциальной личной информации, искусственный интеллект не справился бы.
В будущем исследователи планируют снизить высокие затраты и вычислительную мощность, необходимые для запуска Student of Games, и добиться более высокой производительности.
Исследование показывает, что можно разработать методику, способную работать как для информационно-идеальных, так и для информационно-неполных игр вместо использования специализированных алгоритмов. Кроме того, важным шагом стало создание нового формального подхода, который позволяет по-настоящему обобщенно построить алгоритм поиска.
Игры уже давно служат эталоном прогресса в области искусственного интеллекта. Например, в 2016 году AlphaGo от DeepMind победила профессионального игрока в го. В следующем году система Libratus обыграла лучших в мире игроков в покер в 20-дневном турнире по «Техасскому Холдему». Deep Blue, одолевшая шахматного гроссмейстера и победившая AlphaGo доказала свою силу в настольных играх, где главное умение — анализировать возможные ходы и выбирать лучшую тактику. Однако не так давно искусственный интеллект проявил себя в реальном физическом спорте — в скоростных гонках на дронах.
Любите игры? Смотрите на культовые проекты всех времен и народов: