[Перевод] Стохастический язык программирования на основе алгоритмов Маркова

de15685a5dfba20350816cd4350f1516.gif


MarkovJunior — это вероятностный язык программирования, в котором программы являются сочетаниями правил перезаписи, а инференс выполняется при помощи распространения ограничений. MarkovJunior назван в честь математика Андрея Андреевича Маркова, придумавшего и исследовавшего то, что сейчас называется алгоритмами Маркова.

fea57a7c27a05e317fdcd2d2e691f6a1.gif


41994d98cce3b8d3817284019e91e824.gif


В своей базовой форме программа на MarkovJunior — это упорядоченный список правил перезаписи. Например, показанная ниже анимация MazeBacktracker — это список из двух правил перезаписи:

  1. RBB=GGR, или «заменить красный-чёрный-чёрный на зелёный-зелёный-красный».
  2. RGG=WWR, или «заменить красный-зелёный-зелёный на белый-белый красный».


На каждом этапе исполнения интерпретатор MJ находит первое правило в списке, которые соответствует элементам в сетке, находит все совпадения для этого правила и применяет это правило к случайному совпадению. В примере maze backtracker (алгоритма поиска с возвратом) интерпретатор сначала применяет множество правил RBB=GGR. Но в конце концов зелёное избегающее себя блуждание заходит в тупик. Так как теперь у первого правила нет совпадений, интерпретатор применяет второе правило RGG=WWR, пока блуждание не выйдет из тупика. Затем он снова может применить первое правило, и так далее. Интерпретатор останавливается, когда не остаётся совпадений ни для одного из правил.

a325f5a8377f9d4db3867322f966a927.gif


a2b048fc744287cdda4878bf80ec086f.gif


Вероятностный инференс в MarkovJunior позволяет накладывать ограничения на будущее состояние и генерировать только те прогоны, которые приводят к будущему с ограничениями. Например, инференс в правилах Sokoban {RWB=BRW RB=BR} заставляет группу агентов (красных) выстраивать ящики (белые) в указанные фигуры.

На основе этих идей мы создали множество вероятностных генераторов подземелий, архитектуры, головоломок и интересных симуляций.

13eeaf072a7644526b12caef150d875b.png


Дополнительные материалы:

  1. обзор Xml-синтаксиса.
  2. Скриншоты высокого разрешения и дополнительные сиды: ModernHouse, SeaVilla, Apartemazements, CarmaTower, Escheresque, PillarsOfEternity, Surface, Knots.
  3. Неофициальные технические заметки Дэна Оглса и документация кода Эндрю Кэя.


Алгоритмы Маркова


Алгоритм Маркова для алфавита A — это упорядоченный список правил. Каждое правило — это строка вида x=y, где x и y — слова алфавита A, а некоторые правила могут быть помечены как правила останова. Применение алгоритма Маркова к слову w выполняется следующим образом:

  1. Находим первое правило x=y, где x является подстрокой w. Если таких правил нет, выполняем останов.
  2. Заменяем самый левый x в w на y.
  3. Если найденное правило является правилом останова, выполняем останов. В противном случае переходим к шагу 1.


Например, рассмотрим следующий алгоритм Маркова для алфавита {0, 1, x} (ε — это пустое слово):

1=0x
x0=0xx
0=ε


Если мы применим его к строке 110, то получим следующую последовательность строк:

110 -> 0x10 -> 0x0x0 -> 00xxx0 -> 00xx0xx -> 00x0xxxx -> 000xxxxxx -> 00xxxxxx -> 0xxxxxx -> xxxxxx


В целом, этот алгоритм преобразует двоичное описание числа в его унарное описание.

Студент Маркова Вилнис Детловс доказал, что для любой машины Тьюринга существует алгоритм Маркова, вычисляющий ту же функцию. Для сравнения: грамматики — это неупорядоченные множества правил перезаписи, а L-системы — это правила перезаписи, применяемые параллельно. Более интересные примеры алгоритмов Маркова можно найти в книге Маркова; пример наибольшего общего делителя приведён в комментариях к оригиналу поста, а пример умножения — в Википедии.

Как обобщить алгоритмы Маркова до многомерных операций? Во-первых, при в нескольких измерениях не существует естественных способов вставки строки в другую строку, поэтому левые и правые части правил перезаписи должны иметь одинаковый размер. Во-вторых, отсутствуют естественные способы выбрать самое левое совпадение. Решить эту проблему можно следующими способами:

  • Выбираем случайное совпадение. Именно так поступают узлы (exists) языка MarkovJunior.
  • Выбираем все совпадения. Однако у этого варианта разные совпадения могут пересекаться и иметь конфликты. Возможные решения:
    • Жадный выбор максимального подмножества неконфликтующих совпадений. Именно это делают узлы {forall} языка MarkovJunior.
    • Учёт всех совпадений в суперпозиции. То есть вместо отдельных значений сохраняем в каждой ячейке сетки волны — булевы векторы, сообщающие, какие пространственно-временные паттерны запрещены, а какие нет. И именно так выполняет инференс MarkovJunior.


Мы теряем полноту по Тьюрингу, поскольку наша новая процедура не детерминирована, но практика показывает, что такая формулировка всё равно описывает огромный диапазон интересных случайных процессов.

Правила перезаписи


Наверно, самая простая программа на MarkovJunior — это (B=W). Она содержит всего одно правило B=W. На каждом шаге эта программа преобразует случайный чёрный квадрат в белый.

6786e5cc8d41689e2d06a19e462ff0cd.gif


(B=W)

d30978af775811feb05645b295658dc9.gif


(WB=WW)

abcc13588e0145ad7959762b2868348f.gif


(WBB=WAW)

09b7628ca0b1f031e4601161a38e7dd3.png


(WBB=WAW)

Более интересна модель Growth (WB=WW). На каждом шаге она заменяет чёрно-белую пару соседних клеток BW бело-белой парой WW. Иными словами, на каждом шаге она выбирает случайную чёрную ячейку, соседнюю с какой-то белой ячейкой, и раскрашивает её в белый цвет. Эта модель практически идентична модели роста Идена: на каждом шаге обе модели выбирают в одном множестве чёрных ячеек. Они различаются только распределением вероятностей: равномерное распределение по чёрным ячейкам, соседним с белыми, отличается от равномерного распределения по парам соседних чёрных и белых ячеек.

Модель (WBB=WAW) одной строкой кода генерирует лабиринт! Сравните её с реализацией на традиционном языке программирования. Любую модель MarkovJunior можно без изменений выполнять в любом количестве измерений. На последнем из показанных выше изображений показан конечный результат MazeGrowth в 3D, отрендеренный в MagicaVoxel. По умолчанию мы используем палитру PICO-8:

5013385f1c4e5fda45b500d7d0fcadda.png


Модель (RBB=WWR) — это избегающее себя случайное блуждание. Стоит отметить, что избегающие себя блуждания в 3D в среднем занимают больше шагов, чем в 2D. В целом, сравнение поведений схожих случайных процессов в разных измерениях — потрясающая тема. В классическом результате Джорджа Полиа говорится, что случайное блуждание в 2D возвращается к своей исходной позиции с вероятностью единица, но в 3D это уже не так.

6eb03f356d0724f1f249e8c6cf272e65.gif


(RBB=WWR)

b225f4da0a853a20eeb2d8139b1da47e.gif


LoopErasedWalk

0aeb5ee576b5caaffb32dd91fffb205c.gif


(RB=WR RW=WR)

В один rulenode (узел правил) можно поместить множество разных правил. Например, (RBB=WWR RBW=GWP PWG=PBU UWW=BBU UWP=BBR) — это случайное блуждание с удалёнными петлями. Модель Trail (RB=WR RW=WR) генерирует красивые соединённые пещеры.

Модель (RBB=WWR R*W=W*R) известна как алгоритм генерации лабиринтов Олдоса-Бродера. Символ подстановки * во вводе означает, что в квадрате может быть любой цвет. Символ подстановки в выводе означает, что после применения правила цвет не меняется. В среднем алгоритм Олдоса-Бродера требует гораздо больше шагов для генерации лабиринта, чем, например, MazeGrowth, но обладает удобным свойством, которого нет у MazeGrowth: вероятность генерации каждого из лабиринтов одинакова. Иными словами, MazeTrail — это алгоритм генерации лабиринтов без перекоса, то есть он сэмплирует лабиринты (или связные деревья) с равномерным распределением. Ещё более эффективным алгоритмом генерации лабиринтов без перекосов является алгоритм Уилсона. Сравните его реализацию на MarkovJunior с реализацией на традиционном языке!

Комбинирование узлов правил


Можно поместить множество узлов правил в узел последовательности для выполнения один за другим. В модели River мы сначала создаём стохастическую диаграмму Вороного с двумя источниками и используем границу между образованными областями как основание для реки. Затем мы создаём ещё пару сидов Вороного, чтобы вырастить леса и параллельно растить траву от реки. В результате этого мы получаем случайные долины рек!

8fe3166016c1b592120a8afa9b212624.gif


cd3d231aa74898f910a6a096fc3c4328.gif


В Apartemazements мы начинаем с узла WFC, а затем выполняем конструктивную постобработку при помощи узлов правил:

  1. Подготавливаем ограничения: помечаем нижние ячейки отдельным цветом низа, помечаем оставшиеся ячейки границ (бока и верх) отдельным цветом границ. Ячейки границ должны отображаться в Empty, нижние ячейки должны отображаться во все тайлы, кроме Down.
  2. Выполняем тайлсет Paths WFC для генерации циклов замкнутых лестниц.
  3. Рандомизируем источники освещения.
  4. Сбрасываем столбцы с углов плоских тайлов.
  5. Убираем двойные столбцы, столбцы, которые касаются земли и столбцы, которые касаются лестниц, за исключением столбцов, растущих из углов тайлов Turn.
  6. Выращиваем окна между соседними столбцами.
  7. Объединяем окна в прямоугольники большего размера. Делаем это в несколько шагов:
    1. Выявляем неровные паттерны окон, когда углы окон касаются средних точек окон.
    2. Помечаем эти паттерны и распространяем пометки на полные длины боков окон.
    3. Объединяем непомеченные пары боков окон.

  8. Превращаем оставшиеся окна размером 1×1 в стены.


Более интересный способ объединения узлов заключается в объединении их в узел Маркова. Узлы Маркова существенно расширяют наши возможности, потому что они позволяют возвращаться к предыдущим узлам. Когда узел Маркова активен, интерпретатор находит его первый дочерний узел, имеющий совпадение, и применяет его. На следующем шаге он снова находит следующий совпадающий узел в списке, и так далее. Простейший пример использования узлов Маркова — это MazeBacktracker, объяснённый в одном из предыдущих разделов.

d0395286c167e5bd77928a54aea1d99d.gif


7b7335e18d3ba08c7f3203d464b3a52a.gif


Один из моих примеров, мотивировавших меня на разработку MarkovJunior — это алгоритм генерации подземелий Боба Нистрома. Он имеет следующий вид:

  1. Рисуем сетку {PBB=**P}.
  2. Создаём серию комнат (room.png).
  3. Генерируем лабиринт в оставшейся части сетки. Можно использовать любой алгоритм генерации лабиринтов, но предпочтителен MazeBacktracker, потому что он создаёт меньше точек ветвления.
  4. Делаем получившуюся конфигурацию комнат и коридоров соединённой. Это изящным способом можно сделать при помощи узла Маркова ({GWW=**G}(GBW=*WG)).
  5. Создаём дополнительные соединения (GBG=*W* #5), чтобы получившееся подземелье имело петли. Подземелья без петель довольно скучны, потому что игроку приходится возвращаться через уже исследованные зоны.
  6. Удаляем тупики {BBB/BWB=BBB/BBB}.


de15685a5dfba20350816cd4350f1516.gif


ca0cf9241ef721112402eab10cbbddab.gif


Как в Рефале, узлы Маркова могут быть вложенными: зайдя в дочерний узел, мы игнорируем внешние узлы, пока не завершится дочерняя ветвь.

Инференс


Вероятностный инференс в MarkovJunior позволяет накладывать ограничения на будущее состояние и генерировать только те прогоны, которые ведут к будущему с ограничениями. Иными словами, инференс соединяет два заданных состояния (или частично наблюдаемых состояния) цепочкой правил перезаписи.

Простейший пример использования инференса — это соединение двух точек путём. В модели блуждания с избеганием себя (RBB=WWR) мы можем наблюдать, как квадрат на сетке становится красным (R). Тогда интерпретатор генерирует только те блуждания, которые ведут к наблюдаемому квадрату. Мы можем настроить интерпретатор так, чтобы он стремился к цели более или менее строго, меняя параметр температуры. По умолчанию температура установлена на ноль.

c46236c6cb0d436b4760355c7448617e.gif


Самая низкая температура

3bb9424a3440ba7bdb76fddd2c09507d.gif


Холодная

e3a6dd4cc4db5f106b038929e5931215.gif


Горячая

c954be1a04c14f92cd0c04d30bf07b2c.gif


Максимально высокая

Также мы можем наблюдать за тем, как все нечётные квадраты сетки становятся белыми или красными. Тогда интерпретатор генерирует блуждания с избеганием себя, покрывающие всю сетку.

3d2ba34f94fadb362c7a53f55a5a0371.gif


2fba75bb075157c4301a42a0bdc0babb.gif


Мы можем задействовать инференс для любых правил перезаписи. Например, инференс для правил рисования лестниц соединяет две точки путём-лестницей. Инференс для правила R**/**B=B**/**R генерирует пути, которыми может двигаться шахматный конь. Инференс модели CrossCountry соединяет две точки путём, учитывающим стоимость перемещения по разным типам рельефа. Инференс для набора правил Sokoban {RB=BR RWB=BRW} решает головоломки Sokoban или даже головоломки Sokoban с несколькими агентами!

c7fe09a3f614e47277fd42847e23bfd6.gif


Инференс в MarkovJunior выполняется однонаправленным (быстрое) или двунаправленным (медленное, но более мощное) распространением ограничений. Однонаправленное распространение ограничений для правил перезаписи можно эквивалентно описать на основе полей распространения правил, которые обобщают поля Дейкстры для произвольных правил перезаписи. Правила Дейкстры — популярная техника процедурной генерации на сетках (1, 2, 3). Они, в свою очередь, обобщают поля расстояний, используемые в компьютерной графике.

Если распространение ограничений завершается успешно, это необязательно значит, что целевое состояние достижимо. Но если распространение завершается неудачно, то мы точно знаем, что цель недостижима. Это позволяет отлавливать в Sokoban состояния, когда ящик толкают не к той стене, или когда блуждание с целью заполнения сетки разделяет сетку на две разделённые части. В дополнение к булевой эвристике стоит отслеживать минимальное количество шагов, необходимое для успешного завершения распространения ограничений. Эвристика с целочисленными значениями приемлема, и мы используем её в поиске A* для сэмплирования путей, созданных из правил перезаписи между двумя заданными состояниями.

Нерешённые проблемы


  1. Синтез программ для процедурной генерации. Доклад Уильяма Чира «Level Design in Impossible Geometry» посвящён не совсем процедурной генерации, однако оказался очень характерным для процедурной генерации контента. Уильям сравнивает свои начальный и более поздний подходы к дизайну уровней. В начале он создавал хаотические уровни, а позже — более структурированные, более осмысленные уровни, основанные на одной центральной идее. Такие уровни не были проще, они лишь лучше запоминались и воспринимались игроками.
    9c8kdtox2gihif56gltdtu5r57e.jpeg

    На мой взгляд, левый уровень выглядит так, как будто генерировался процедурно! Он очень похож по ощущениям на мои процедурные воксельные головоломки. Можем ли мы писать генераторы, создающие уровни, которые больше похожи на правый? Может показаться, что ИИ готов справиться с такой задачей. Но я возражу, что она очень похожа на классические задачи генетического программирования наподобие задачи газонокосилки Козы. Например, возьмём простую задачу процедурной генерации по созданию гамильтоновых путей на сетке. Даже для небольших размеров сетки наподобие 29×29 эта задача уже вычислительно затратна. Но действительно ли нам нужно на практике сэмплировать из всех возможных путей? Если мы дадим эту задачу человеку, то он, скорее всего, нарисует спираль или зигзаг, а это гораздо более запоминающиеся и логичные структуры, чем случайный гамильтонов путь, плюс их можно обобщить до любых размеров сетки. Подводём итог: мы можем попросить систему или найти случайный гамильтонов путь, или короткую программу, генерирующую гамильтоновы пути. В первом случае результат будет похож на левый уровень слайда, во втором случае — на правый уровень. Решение задачи синтеза программ создаст более запоминающиеся и логичные генераторы.
  2. Синтез моделей из примеров. Похоже, алгоритмы Маркова являются идеальной средой для синтеза программ/моделей: никаких переменных, if или while, узлы можно легко перемещать без нарушения корректности, модели легко делать различающимися. Случайные программы на Random MarkovJunior часто любопытны и могут создавать приятные человеку результаты и поведения.
    1. Можно ли синтезировать модель MarkovJunior из результата или множества результатов?
    2. Можно ли определить (или присвоить вероятности), сгенерирован ли лабиринт MazeGrowth или MazeBacktracker?
    3. Решить Abstraction and Reasoning Challenge инференсом моделей MarkovJunior. Примыкающая задача: использовать наблюдения из ARC с целью создания улучшенного DSL для процедурной генерации на сетке.
  3. Произвольные алгоритмы, выполняемые в волновом пространстве. Объединить преимущества конструктивной процедурной генерации и генерации на основании ограничений. Связанная задача: произвольные алгоритмы (правила перезаписи MarkovJunior) с произвольными функциями энергии, например, энергии Изинга или энергии ConvChain.
  4. Обобщение записи паттерна.
  5. Исследование подобных MarkovJunior процессов на других (возможно, неравномерных) сетках или произвольных графах.
  6. Эксперименты с интерактивными расширениями алгоритмов Маркова. Можно превратить любую модель MarkovJunior в игру, присвоив нажатиям клавиш правила или узлы перезаписи.
  7. Расширение возможностей процедурной генерации на сетках. ModernHouse пока не достиг структурной вариативности создаваемых людьми домов, например, домов в Sims 2. Нужно применять более тонкие ограничения.


Комментарии


По сравнению с машинами Тьюринга и лямбда-исчислением, алгоритмы Маркова, вероятно, являются простейшим и кратчайшим способом формулирования строгого определения того, что же такое алгоритм.

Упражнение: доказать, что следующий алгоритм Маркова находит наибольший общий делитель двух чисел, записанных в унарном представлении. Например, если мы применим его к 111111*1111111111, то получим 11.

1a=a1
1*1=a*
1*=*b
b=1
a=c
c=1
*=ε (останов)


Быстрое сопоставление паттернов. Сэмплы интерпретатора MarkovJunior совпадают равномерно, но на каждом шаге он не сканирует всю сетку. Чтобы сохранить высокую скорость сопоставления паттернов, интерпретатор запоминает ранее найденные совпадения и ищет только вокруг изменившихся участков. Когда узел правил встречается в первый раз, интерпретатор MarkovJunior использует многомерную версию алгоритма Бойера-Мура.
Стохастическая релаксация. Узлы Маркова имеют имеют очень удобные описания как границы дифференцируемых узлов. Рассмотрим неупорядоченное множество правил перезаписи, где каждому правилу r присвоен вес w(r). На каждом шаге интерпретатор находит все совпадения для всех правил и выбирает случайное совпадение согласно распределению Больцмана p(r) ~ exp(-w(r)/t). Находясь на границе замерзания t->0, мы получаем узел Маркова, упорядоченный по весам. В этой конструкции удобно то, что для любой t>0 и для типичной функции отсчёта среднее значение отсчёта в многократных прогонах будет непрерывной (и гладкой для практических применений) функцией весов. Это значит, что можно найти оптимальные веса при помощи градиентного спуска, а затем заморозить систему, чтобы получить готовую дискретную программу.

Прочитайте это эссе Бориса Кушнера об А.А. Маркове и его работах по конструктивной математике.

Использованные труды


Главный использованный труд:

  1. Андрей А. Марков, The Theory of Algorithms, 1951 год. Марков использовал эти идеи ещё в 1947 году для доказательства алгоритмической неразрешимости задачи тождества слов в полугруппах. См. также более позднюю книгу с более подробным разбором. Я был бы благодарен за ссылки на английские переводы в открытом доступе.
  2. Guilherme S. Tows, Imagegram, 2009 год. Узлы forall для MarkovJunior взяты из Imagegram.
  3. Валентин Турчин, REFAL language, 1968 год. Идею вложенных узлов Маркова взята из Рефала.
  4. Brian Walker et al., The incredible power of Dijkstra maps, 2010 год. Обсуждение в сообществе разработчиков roguelike, содержащее множество техник применения карт/полей расстояний Дейкстры для процедурной генерации и искусственного интеллекта NPC. Другие статьи: 1, 2. Мы обобщаем карты Дейкстры до произвольных правил перезаписи.
  5. Pavlos S. Efraimidis, Paul Spirakis, Weighted Random Sampling, 2005 год.
  6. Работы, использованные для произвольных узлов: Model Synthesis, Wave Function Collapse Algorithm, ConvChain Algorithm.
  7. Классические алгоритмы: распространение ограничений, алгоритмы решения ограничений, обход графов, поиск A*.


Связанные работы:

  1. Daniel Ritchie, Probabilistic Programming for Procedural Modeling and Design, 2016 год.
  2. Lingfeng Yang, From Execution Traces to Specialized Inference, 2015 год.


Источники примеров:

  1. BasicKeys и Keys являются адаптациями графовых грамматик, сформулированных Йорисом Дормансом в Engineering Emergence: Applied Theory for Game Design, 2012 год. Они, в свою очередь, являются дальнейшим развитием работы Дэвида Адамса Automatic Generation of Dungeons for Computer Games, 2002 год. Я использовал вариацию этих моделей для генерации головоломок «ключ-замок-мост» в SeaVilla.
  2. CarmaTower является процедурализацией воксельной сцены Антуана Лендреви.
  3. Модель NystromDungeon — это порт генератора подземелий Боба Нистрома для MarkovJunior.
  4. Алгоритм HamiltonianPath адаптирован из этой статьи. Сравните его с реализацией на традиционном языке.
  5. Формы комнат в DungeonGrowth взяты из поста на r/proceduralgeneration. Обратите внимание, что интерпретатор MarkovJunior автоматически выполняет описанные в посте оптимизации.
  6. Модель Wilson — это формулировка в правилах перезаписи алгоритма Уилсона. Сравните её с реализацией на традиционном языке.
  7. Модель MazeGrowth также известна как генерация лабиринтов при помощи случайного обхода (maze generation via random traversal). Сравните её с реализацией на традиционном языке.
  8. Growth тесно связана с моделью роста Идена.
  9. BernoulliPercolation — это хорошо изученная модель в теории перколяции.
  10. NestedGrowth взята из Imagegram.
  11. SmoothTrail адаптирована из твита 128_mhz.
  12. SokobanLevel1, похоже, является первым уровнем из головоломки Sokoban Хироюки Имабаяси. SokobanLevel2 — это уровень 452 из набора Ionic Catalysts XI.
  13. RainbowGrowth была предложена пользователем mure.
  14. MultiHeadedWalk, MultiHeadedDungeon и MultiHeadedWalkDungeon основаны на идее Ильи Кудрицкого.
  15. Модель Island создана Гийомом Фьетом.
  16. Модели LostCity, Forest и Texture основаны на модели Эндрю Кэя.


Воксельные сцены отрендерены в MagicaVoxel, разработанной ephtracy. Особая благодарность Брайану Баклью за демонстрацию мощи полей Дейкстры на примере генерации уровней roguelike и Кевину Шапелье за множество хороших подсказок. В GUI использован шрифт Tamzen.

Как выполнять сборку


Интерпретатор MarkovJunior — это консольное приложение, зависящее только от стандартной библиотеки. Установите .NET Core для Windows, Linux или macOS и выполните следующую команду:

dotnet run --configuration Release MarkovJunior.csproj


Также можно скачать и запустить последний релиз для Windows.

Сгенерированные результаты помещаются в папку output. Для изменения параметров моделей отредактируйте models.xml. Файлы .vox открываются при помощи MagicaVoxel.

Важные порты, форки и спиноффы


© Habrahabr.ru