Стратегического покерного бота Libratus адаптировали для военных симуляторов

5c1ff12b333528705f2876e715e3f241.pngВ 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения.

Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.
Libratus («сбалансированный» с латинского языка) создан исследователями из Университета Карнеги-Меллона для тестирования идей автоматизированного принятия решений на основе теории игр. В начале прошлого года, после громкой победы над профессионалами, ведущий автор программы, профессор Туомас Сандхолм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию для использования правительством. Например, в военных играх и симуляциях для изучения военной стратегии и планирования. В конце августа, согласно публичным записям, компания заключила двухлетний контракт с армией США на сумму до $10 млн. Финансирование выделено Отделением оборонных инноваций (Defense Innovation Unit), которое Пентагон образовал в 2015 году для улучшения контактов с компаниями Кремниевой долины и более активного внедрения новых технологий.

8b60c8d8e922a43af5dbf659499e1466.png
Стратегия Libratus на различных этапах раздачи. По итогам раздачи модель игры против конкретного оппонента уточняется

Libratus построен на алгоритмической (вычислительной) теории игр. В хэдзапах с профессионалами бот выиграл более 1,8 миллиона условных долларов: на протяжении турнира он разработал мощные стратегии ставок и даже продемонстрировал возможность блефа.

Сандхолм уверен, что этот подход применим ко многим другим играм, а также военным симуляторам. Сейчас военные игровые упражнения обычно проверяют только небольшое количество стратегий для воображаемых противников: «Это открывает перед вами много возможностей для эксплуатации, потому что настоящий противник может играть не в соответствии с вашими предположениями», — говорит профессор.

Сандхолм отказывается обсуждать специфику проектов Strategy Robot, хотя фирма заключила ещё как минимум один государственный контракт. Он говорит, что программа помогает в имитационных задачах, которые включают в себя принятие решений в моделируемом физическом пространстве, например, где разместить воинские части.

Покерная техника Libratus позволяет предположить, что стратегический бот может дать военным некоторые удивительные рекомендации. Профессиональные игроки, которые противостояли боту, по ходу турнира с удивлением обнаружили, что он неожиданно переключается с тайтовой на гиперагрессивной тактику, так что его действия практически невозможно предсказать —, но все действия бота строго нацелены на победу. «Это странно, потому что нет впечатления, что он играет лучше вас, но затем вы смотрите на счёт и понимаете, что произошло», — говорит Сандхолм.

По мнению специалистов, подобные технологии могут сделать военные игры и симуляции более полезными, хотя результаты всё равно останутся лишь одним из компонентов стратегического планирования. Реальный мир намного сложнее и запутаннее, чем сценарии, которые способны освоить даже лучшие технологии ИИ.

Стратегический бот Libratus — не единственная попытка Пентагона применить современную теорию игр и слабый ИИ в военном деле. Исследовательское агентство DARPA запустило специальную программу «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)». Майкл Уэллман, профессор Мичиганского университета, говорит, что пример Libratus показывает: технология почти созрела для реального применения: «Прорыв в покере был просто поразительным, и с другими играми дела идут быстро. Пришло время попробовать это в более реальных областях», — сказал он.

Кроме Strategy Robot, профессор Сандхолм основал ещё один стартап Strategic Machine, где адаптирует стратегического бота для коммерческих задач, таких как рынки электроэнергии, спорт и компьютерные игры.

Технологии ИИ интересуют военных не только США, но также России и Китае, пишет Wired. Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».

© Habrahabr.ru