[Перевод] Как археологи используют машинное обучение, чтобы копать глубже
Доктор Джино Каспари (справа) во время геофизических исследований королевской скифской гробницы на юге Сибири в 2018 году. Фото: Тревор Уоллес
Найти гробницу древнего царя, полную золотых артефактов, оружия и изысканной одежды, — голубая мечта любого археолога. Но искать такие объекты невероятно утомительно, сказал бы вам доктор Джино Каспари.
Джино Каспари, археолог-исследователь из Швейцарского национального научного фонда, изучает культуру древних скифов и кочевников, которые терроризировали население равнин Азии 3000 лет назад. В гробницах скифской знати хранится большая часть сказочных богатств, украденных ими у соседей. С того момента, как тела вождей предавали земле, могилы становились мишенями для грабителей. По оценкам доктора Каспари, более 90% из них уже уничтожены и разорены.
Ученый подозревает, что тысячи гробниц разбросаны по евразийским степям, простирающимся на миллионы квадратных километров. Он часами занимался картированием захоронений, используя изображения Google Earth на территории современной России, Монголии и провинции Синьцзян в Западном Китае.
«На самом деле, это довольно скучная и однообразная работа, — рассказывает доктор Каспари. — И это явно не то, чем должен заниматься высокообразованный ученый».
Найти более оптимальное решение для задач ученого удалось аспиранту экономического факультета Городского университета Нью-Йорка Пабло Креспо. Он работал с искусственным интеллектом, оценивая волатильность сырьевых рынков. Пабло подсказал доктору Каспари, что в поиске потенциальных скифских гробниц ему может помочь сверточная нейронная сеть — она сможет проанализировать изображения со спутника не хуже уважаемого ученого.
Пабло и Джино были «коллегами» по International House (всемирная сеть из 160 языковых школ и педагогических институтов более чем в 50 странах). Их объединяла вера в важность общедоступности знаний и академического сотрудничества. Еще они оба любили хеви-метал. За кружкой пива они дали старт научному партнерству и открыли новую страницу в истории археологических исследований.
Доктор Каспари часами занимался картированием скифских захоронений на огромной территории современной России, Монголии и Китая с использованием изображений Google Earth. Фото: Пабло Креспо
Изображения гробниц, которые использовали Пабло Креспо и доктор Каспари для обучения нейронной сети. Фото: Пабло Креспо
Сверточная нейронная сеть (convolutional neural network, CNN) идеально подходит для анализа фотографий и других изображений. CNN видит изображение как сетку из пикселей. Нейронная сеть, разработанная Пабло Креспо, начинает с того, что присваивает каждому пикселю рейтинг в зависимости от его цвета — насколько он красный, зеленый или синий. После оценки каждого пикселя в соответствии с множеством дополнительных параметров сеть начинает анализировать небольшие группы пикселей, затем — более крупные, ища совпадения с данными, которые она была обучена обнаруживать.
Работая в свободное время, два исследователя в течение нескольких месяцев проанализировали через сеть 1212 спутниковых снимков, осуществляя поиск круглых каменных гробниц. Сложность состояла в том, чтобы не путать их с другими круглыми объектами, такими как груды строительного мусора и оросительные пруды.
Сначала они работали с изображениями площадью около 2000 квадратных километров. Они использовали три четверти изображений, чтобы обучить сеть тому, как выглядит скифская гробница, и поправляя ее, когда она пропускала гробницу или выделяла как захоронение иные объекты. Остальные изображения ученые оставили для контрольной проверки системы. В итоге сеть корректно опознавала гробницы в 98% случаев.
По словам доктора Креспо, создать сеть было несложно. Он развернул ее менее чем за месяц, используя Python, без лишних затрат. Если, конечно, не считать купленное и выпитое за этот месяц пиво. Доктор Каспари надеется, что СNN поможет археологам находить новые гробницы, чтобы их можно было защитить от охотников за сокровищами.
Сверточные нейронные сети помогают автоматизировать научные задачи, связанные с бесконечно повторяющимися действиями, — обычно такую работу сваливают на аспирантов. Искусственный интеллект открывает новые окна в прошлое. Так, сети научились классифицировать фрагменты керамики, обнаруживать затонувшие корабли по изображениям гидролокатора, находить человеческие кости, продающиеся на черном рынке в интернете.
«С помощью подобной технологии Netflix дает нам рекомендации по фильмам, — говорит Пабло Креспо, ныне старший научный сотрудник компании Etsy. — Почему бы нам не использовать ее для чего-то вроде сохранения человеческой истории?»
Габриэле Гаттилья и Франческа Аничини, археологи из Пизанского университета в Италии, проводят раскопки в районе памятников эпохи Римской империи, что влечет за собой анализ тысяч битых кусков керамики. В римской культуре почти все типы посуды, включая инвентарь для приготовления пищи и амфоры, используемые для перевозки товаров по Средиземному морю, были сделаны из глины. Поэтому анализ керамики важен для понимания жизни древних римлян.
Слева — доктор Франческа Аничини. Справа — Габриэле Гаттилья. Источник: Пизанский университет, MAPPALab
Проект ArchAIDE позволит археологам сфотографировать керамику в полевых условиях и идентифицировать ее с помощью сверхточных нейронных сетей. Источник: Пизанский университет, MAPPALab
Задача заключается в сравнении черепков глиняной посуды с изображениями в печатных каталогах. По оценкам доктора Гаттиглиа и доктора Аничини, только 20% их времени уходит на раскопки. Остальное тратится на анализ гончарного дела — работу, за которую им не платят.
«Мы давно мечтали о каком-то волшебном инструменте для распознавания глиняной посуды на раскопках», — сказал доктор Гаттиглиа.
Эта мечта вылилась в проект ArchAIDE — цифровое решение, которое позволит археологам сфотографировать найденную керамику в полевых условиях и идентифицировать ее с помощью нейросетей. В проекте, получившем финансирование проекта Horizon 2020, теперь участвуют исследователи со всей Европы, а также группа ученых-информатиков из Тель-Авивского университета в Израиле, которые и разработали нейронную сеть.
Проект включал в себя оцифровку бумажных каталогов и обучение нейронной сети распознаванию различных типов керамических сосудов на основе этих изображений. Вторая сеть была обучена распознавать контуры черепков керамики. Пока что ArchAIDE может идентифицировать только несколько конкретных типов керамики, но по мере роста базы данных ожидается, что возможности нейросети будут расти.
«Я мечтаю о каталоге всех видов керамики, — сказал доктор Аничини. — Но кажется, это работа не на одну жизнь».
Экономия времени — одно из самых больших преимуществ нейросетей. В подводной археологии время стоит дорого, дайверы-исследователи не могут проводить слишком много времени под водой, не рискуя при этом здоровьем. Крис Кларк, инженер из колледжа Харви Мадда в Клермонте, штат Калифорния, решает обе проблемы, используя робота для сканирования морского дна, а затем использует нейросеть для обработки полученных изображений. В последние годы он работал с Тимми Гамбином, археологом из Мальтийского университета, над изучением дна Средиземного моря вокруг острова Мальта.
Старт был непростым: во время одного из первых «заплывов» робот столкнулся с местом кораблекрушения, и ученым пришлось отправить за ним водолаза. После этого эксцесса все стало лучше. В 2017 году нейросеть идентифицировала то, что оказалось обломками пикирующего бомбардировщика времен Второй мировой войны. Сейчас доктор Кларк и доктор Гамбин работают над другой задачей, но пока не хотят раскрывать детали.
Исследователи запускают автономный подводный аппарат с побережья Мальты. Фото: доктор Зои Вуд / Колледж Харви Мадда.
Трехмерная реконструкция обломков самолета времен Второй мировой войны у побережья Мальты. Реконструкция была построена с использованием данных датчиков, полученных с автономного подводного аппарата. Источник: Колледж Харви Мадда.
Шон Грэм, профессор в области digital humanities в Карлтонском университете в Оттаве, использует в работе нейросеть под названием Inception 3.0. CNN, разработанная Google, помогает искать через изображения в интернете объявления о покупке или продаже человеческих костей. В Соединенных Штатах и многих других странах действуют законы, требующие, чтобы человеческие кости, хранящиеся в музейных коллекциях, возвращались потомкам «владельцев» костей. Но есть люди, которые нарушают этот закон. Доктор Грэм сказал, что он даже находил в интернете видео о людях, копающих могилы, чтобы насытить черный рынок.
Он внес некоторые изменения в сеть Inception 3.0, чтобы она могла распознавать фотографии человеческих костей. Система уже была обучена распознавать объекты на миллионах изображений, но ни один из этих объектов не был костями. С тех пор он обучил свою нейросеть на более чем 80 000 изображений человеческих костей. Сейчас ученый взаимодействует с организацией под названием «Противодействие преступности в Интернете», которая использует нейронные сети для отслеживания изображений, связанных с незаконной торговлей слоновой костью и секс-рабством.
Ученый Креспо и Каспари убеждены, что социально-гуманитарные науки только выиграют от внедрения IT. Их сверточная нейронная сеть проста в использовании и доступна для модификаций в соответствии с исследовательскими задачами. В конечном итоге, по их словам, научные достижения сводятся к двум вещам.
«Новые открытия случаются на пересечении уже изученного», — говорит Джино Каспари. «Время от времени не отказывайте себе выпить пива с соседом», — заключает его коллега доктор Креспо.