[Перевод] Как искусственный интеллект меняет науку
Новейшие алгоритмы ИИ разбираются в эволюции галактик, подсчитывают функции квантовых волн, открывают новые химические соединения, и прочее. Есть ли что-нибудь в работе учёных, что не получится автоматизировать?
Никакой человек или даже группа людей не может поспевать за водопадом информации, производимой огромным количеством экспериментов по физике и астрономии. Некоторые из них оставляют после себя терабайты данных ежедневно, и этот поток лишь увеличивается. Антенная решётка Square Kilometre Array, радиотелескоп, который планируют включить в середине 2020-х, будет выдавать ежегодно объём данных, сравнимых со всем интернетом целиком.
Это наводнение данных заставило многих учёных обратиться за помощью к искусственному интеллекту (ИИ). С минимальным участием человека такие ИИ-системы, как нейросети — симулированные на компьютере сети нейронов, имитирующие работу мозга — способны пробираться сквозь горы данных, находя аномалии и распознавая последовательности, которые люди никогда бы не заметили.
Конечно, помощь компьютеров в научных исследованиях используется уже около 75 лет, а метод ручного перебора данных в поисках осмысленных последовательностей придумали тысячи лет назад. Но некоторые учёные утверждают, что последние технологии машинного обучения и ИИ представляют принципиально новый способ занятий наукой. Один из таких подходов, генеративное моделирование (ГМ), может помочь определить наиболее вероятную теорию среди соревнующихся объяснений наблюдаемых данных, на основе лишь этих данных, и без какого бы то ни было заранее запрограммированного знания о том, какие физические процессы могут происходить в исследуемой системе. Сторонники ГМ считают его достаточно инновационным, чтобы рассматривать, как потенциальный «третий путь» изучения Вселенной.
Обычно мы приобретаем знания о природе через наблюдения. Как Иоганн Кеплер изучал таблицы положения планет Тихо Браге, пытаясь найти лежащую в их основе закономерность (он в итоге понял, что планеты движутся по эллиптическим орбитам). Наука также продвигалась вперёд благодаря симуляциям. Астроном может смоделировать движение Млечного Пути и соседней галактики, Андромеды, и предсказать, что через несколько миллиардов лет они столкнутся. Наблюдения и симуляции помогают учёным создавать гипотезы, которые можно проверить при помощи будущих наблюдений. ГМ отличается от обоих этих подходов.
«По сути, это третий подход, между наблюдениями и симуляцией», — говорит Кевин Шавинский, астрофизик и один из наиболее активных сторонников ГМ, до недавнего времени работавший в Федеральном технологическом институте Швейцарии. «Это другой способ атаковать задачу».
Некоторые учёные считают ГМ и другие технологии просто мощными инструментами для занятий традиционной наукой. Но большинство соглашаются в том, что ИИ значительно повлияет на этот процесс, и его роль в науке будет лишь расти. Брайан Норд, астрофизик из Национальной ускорительной лаборатории Ферми, использующий искусственные нейросети для изучения космоса, принадлежит к тем, кто боится, что ни одно из занятий учёного-человека не избегнет автоматизации. «Мысль довольно ужасающая», — сказал он.
Открытие поколения
Ещё в институте Шавинский начал строить себе репутацию в науке, работающей на основе данных. Работая над докторской, он встретился с задачей классификации тысяч галактик на основе их внешнего вида. Для этой задачи не было готовых программ, поэтому он решил организовать для этой цели краудсорсинг — так родился проект «Галактического зоопарка». С 2007 года обычные пользователи могли помочь астрономам, строя предположения о том, какая галактика принадлежит к какой категории, и обычно большинство голосов правильно классифицировало галактику. Проект увенчался успехом, однако, как отмечает Шавинский, ИИ сделал его бессмысленным: «Сегодня талантливый учёный, имеющий опыт в МО и доступ к облачным вычислениям, может сделать подобный проект за полдня».
Шавинский обратился к новому мощному инструменту ГМ в 2016-м. По сути, ГМ задаёт вопрос: насколько вероятно, что при условии Х мы получим результат Y? Этот подход оказался невероятно действенным и универсальным. К примеру, допустим, вы скормили ГМ набор изображений человеческих лиц, причём для каждого человека проставлен его возраст. Программа прочёсывает эти обучающие данные и начинает находить связь между старыми лицами и увеличением вероятности появления на них морщин. В итоге она может выдать возраст любого заданного лица — то есть, предсказать, какие физические изменения заданное лицо любого возраста, скорее всего, претерпит.
Ни одно из этих лиц не является настоящим. Верхний ряд (А) и левый столбец (В) созданы генеративно-состязательной сетью (ГСС) с использованием строительных блоков, полученных из элементов реальных лиц. Затем ГСС скомбинировала основные черты лиц ряда А, включая пол, возрасти и форму лица, с более мелкими чертами лиц столбца В, к примеру, цвет волос и глаз, и создала лица в оставшейся части таблицы.
Из ГМ-систем наиболее известны генеративно-состязательные сети (ГСС). После обработки адекватных обучающих данных ГСС может восстанавливать изображения с отсутствующими или повреждёнными пикселями или делать размытые фото чёткими. ГСС обучаются извлекать недостающую информацию на основе состязания (отсюда и «состязательные»): одна часть сети, генератор, генерирует ложные данные, а вторая, дискриминатор, пытается отличить ложные данные от реальных. Во время работы программы обе её части постепенно работают всё лучше. Вы, возможно, видели некоторые сверхреалистичные «лица», созданные ГСС — изображения «невероятно реалистичных людей, не существующих в действительности», как писали в одном из заголовков.
В более общем случае ГМ берёт набор данных (обычно это изображения, но не обязательно), и разбивает их на подмножества базовых абстрактных строительных блоков — учёные называют их «скрытым пространством» данных. Алгоритм манипулирует элементами скрытого пространства, чтобы посмотреть, как это повлияет на изначальные данные, чем и помогает раскрыть физические процессы, обеспечивающие работу системы.
Идея скрытого пространства абстрактна и её тяжело представить, но в качестве грубой аналогии подумайте о том, чем может заниматься ваш мозг, когда вы пытаетесь определить пол человека по лицу. Возможно, вы замечаете причёску, форму носа, и так далее, а также закономерности, которые нелегко описать словами. Компьютерная программа тоже ищет скрытые признаки в данных: хотя она не имеет представления о том, что такое усы или пол, если её обучали на наборе данных, в котором некоторые изображения помечены «мужчина» или «женщина», а у некоторых есть метка «усы», она быстро поймёт взаимосвязь.
Кевин Шавинский, астрофизик, глава ИИ-компании Modulos
В работе, опубликованной в декабре в журнале Astronomy & Astrophysics, Шавинский и его коллеги, Денис Тарп и Че Жен использовали ГМ для исследования физических изменений галактик в процессе эволюции (используемое ими ПО рассчитывает скрытое пространство немного не так, как ГСС, поэтому технически его нельзя назвать ГСС, хотя оно и довольно близко по свойствам). Их модель создавала искусственные наборы данных для проверки гипотез по поводу физических процессов. Они, к примеру, спрашивали, как «затухание» формирования звёзд — резкое уменьшение скорости их формирования — связано с увеличением плотности галактики.
Для Шавинского, ключевой вопрос состоит в том, сколько информации о звёздных и галактических процессах можно извлечь на основе только одних данных. «Исключим всё, что мы знаем об астрофизике, — сказал он. — До какой степени мы сможем заново открыть эти знания, используя только данные?»
Во-первых, изображения галактик были сведены к скрытому пространству; затем Шавинский мог подправить один элемент этого пространства так, чтобы он соответствовал определенному изменению в окружении галактики — к примеру, плотности её окружения. Затем он мог заново сгенерить галактику и посмотреть, какие различия появятся на этот раз. «И теперь у меня есть машина для генерации гипотез, — пояснил он. — Я могу взять кучу галактик, изначально находившихся в окружении с низкой плотностью, и сделать так, будто плотность их окружения высокая». Шавинский, Тарп и Жен обнаружили, что переходя от меньшей к большей плотности окружения они становятся краснее, а их звёзды концентрируются плотнее. Это совпадает с существующими наблюдениями галактик, сказал Шавинский. Вопрос только, почему.
Следующий шаг, говорит Шавинский, пока ещё не успели автоматизировать. «Мне, человеку, необходимо вмешиваться и говорить: Ну хорошо, какого рода физика может объяснить этот эффект?» Для данного процесса есть два возможных объяснения: возможно, галактики становятся краснее в более плотных окружениях, потому что в них содержится больше пыли, или же потому, что в формировании звёзд появляется спад (иначе говоря, их звёзды обычно старше). При помощи генеративной модели мы можем подвергнуть проверке обе идеи. Мы меняем элементы скрытого пространства, связанные с пылью и со скоростью формирования звёзд, и смотрим, как это влияет на цвет галактик. «И ответ ясен», — сказал Шавинский. Более красные галактики — это те, «где скорость формирования звёзд упала, а не те, где больше пыли. Поэтому мы склоняемся в пользу первого объяснения».
Верхний ряд — реальные галактики в регионах низкой плотности.
Второй ряд — реконструкция на основе скрытого пространства.
Далее идут трансформации, сделанные сетью, и внизу — сгенерированные галактики в регионах высокой плотности
Подход связан с традиционными симуляциями, но обладает кардинальными отличиями. Симуляция, по сути, «делается на основе предположений, — сказал Шавинский. — Этот всё равно, что сказать: «Я думаю, что понял, какие физические основы лежат в основе всего, что я наблюдаю в системе». У меня есть рецепт для формирования звёзд, для поведения тёмной материи, и так далее. Я размещаю все мои гипотезы и запускаю симуляцию И потом спрашиваю: Похоже это на реальность?» А с генеративным моделированием это, по его словам, выглядит «в некотором смысле полной противоположностью симуляции. Мы ничего не знаем, ничего не хотим предполагать. Мы хотим, чтобы данные сами сказали нам, что может происходить».
Явный успех генеративного моделирования в подобном исследовании, очевидно, не означает, что астрономы и аспиранты стали не нужны –, но он, судя по всему, демонстрирует сдвиг степени, до которой ИИ может узнать что-либо по поводу астрофизических объектов и процессов, имея перед собой практически лишь огромный объём данных. «Это не полностью автоматизированная наука, но она демонстрирует, что мы способны создавать инструменты, автоматизирующие научный прогресс хотя бы частично», — сказал Шавинский.
Генеративное моделирование, очевидно, способно на многое –, но представляет ли оно реально новый подход к науке, это вопрос спорный. Для Дэвида Хогга, космолога из Нью-Йоркского университета и Флэтайронского института, эта технология хоть и впечатляющая, но, по сути, представляет собой очень сложный способ извлечения последовательностей из данных –, а астрономы занимаются этим уже много столетий. Иначе говоря, это продвинутый метод наблюдения и анализа. Работа Хогга, как и Шавинского, сильно зависит от ИИ; он использует нейросети для классификации звёзд по спектру и получения выводов о других физических свойствах звёзд при помощи моделей, работающих на основе данных. Но он считает свою работу, и работу Шавинского, старым, добрым, проверенным научным методом. «Я не думаю, что это третий способ», — сказал он недавно. «Я просто думаю, что мы, как сообщество, всё сложнее используем наши данные. В частности, мы гораздо лучше научились сравнивать данные. Но с моей точки зрения, моя работа прекрасно вписывается в рамки режима наблюдений».
Усердные ассистенты
Являются ли ИИ и нейросети концептуально новыми инструментами, или нет, очевидно, что они начали играть критически важную роль в современной астрономии и физических исследованиях. В Институте теоретических исследований Гейдельберга физик Кай Польстерер ведёт группу по астроинформатике — это команда исследователей, работающих с новыми методами в астрофизике, основанными на обработке данных. Недавно они использовали алгоритм с МО для извлечения информации о красном смещении из наборов данных о галактиках — задачи, прежде бывшей изнурительной.
Польстерер считает эти новые системы на базе ИИ «усердными ассистентами», способными часами прочёсывать данные, не впадая в скуку и не жалуясь на условия работы. Эти системы могут делать всю монотонную и тяжёлую работу, сказал он, оставляя нам «крутую, интересную науку».
Но они не идеальны. В частности, предупреждает Польстерер, алгоритмы могут делать только то, чему их обучили. Система равнодушна к входным данным. Дайте ей галактику, и она сможет оценить её красное смещение и возраст. Но дайте ей сэлфи или фото гнилой рыбы, она и у них оценит возраст (естественно, неправильно). В итоге, сказал он, остаётся необходимым надзор со стороны людей. «Всё замыкается на нас, на исследователях. Мы отвечаем за интерпретацию».
Со своей стороны Норд из Фермилаб предупреждает, что важно, чтобы нейросети выдавали не только результаты, но и погрешности работы, как приучен любой студент. В науке так принято, что если вы провели измерение, но не привели погрешность, никто не примет ваши результаты всерьёз.
Как многие исследователи ИИ, Норд также беспокоится о том, что результаты, выданные нейросетями, сложно понять; нейросеть выдаёт ответ, не предоставляя понятного способа его получения.
Однако не все считают, что отсутствие прозрачности представляет проблему. Ленка Здеборова, исследователь из Института теоретической физики во Франции, указывает на то, что человеческую интуицию тоже иногда невозможно понять. Вы смотрите на фотографию и узнаёте, что на ней изображён кот — «но вы не знаете, откуда вам это известно, — говорит она. — Ваш мозг в каком-то смысле тоже чёрный ящик».
В сторону занятий наукой при помощи ИИ и обработки данных мигрируют не только астрофизики и космологи. Специалист по квантовой физике Роджер Мелко из Института теоретической физики Периметр и Университета Ватерлоо использовал нейросетя для решения одних из самых сложных и важных проблем в этой области, к примеру, представления волновой функции, описывающей систему из многих частиц. ИИ здесь необходимо из-за того, что Мелко называет «экспоненциальным проклятием размерности». То есть, количество возможных форм волновой функции экспоненциально растёт с увеличением количества частиц в описываемой системе. Сложность похожа на попытки выбора наилучшего хода в игре типа шахмат или го: вы пытаетесь просчитать следующий ход, представляя, как пойдёт ваш оппонент, и выбирает наилучший ответ, но с каждым ходом количество возможностей растёт.
Конечно, ИИ овладел обеими этими играми, научившись играть в шахматы несколько десятилетий назад, и обыграв лучшего игрока в го в 2016-м — это сделала система AlphaGo. Мелко говорит, что они так же хорошо приспособлены и к задачам квантовой физики.
Машинный разум
Прав ли Шавинский, заявляя, что нашёл «третий способ» заниматься наукой, или же, как говорит Хогг, это просто традиционные наблюдения и анализ данных «на стероидах», ясно, что ИИ меняет суть научного открытия, и явно ускоряет его. Как далеко зайдёт в науке революция ИИ?
Периодически звучат громкие заявления по поводу достижений «робо-учёных». Десять лет назад робот-химик Adam исследовал геном дрожжей и установил, какие гены отвечают за выработку определённых аминокислот. Он сделал это, наблюдая за штаммами дрожжей, у которых отсутствовали определённые гены, и сравнивая результаты их поведения друг с другом. В журнале Wired писали «Робот самостоятельно сделал научное открытие».
Чуть позже Ли Кронин, химик из Университета Глазко, использовал робота для случайного смешивания химических веществ, чтобы узнать, не появятся ли какие-нибудь новые соединения. Отслеживая реакции в реальном времени при помощи масс-спектрометра, машины, работающей на ядерном магнитном резонансе, и при помощи инфракрасного спектрометра, система в итоге научилась предсказывать наиболее реактивные комбинации. Даже несмотря на то, что это не привело к открытиям, сказал Кронин, роботизированная система может позволить химикам ускорить их исследования на 90%.
В прошлом году ещё одна команда учёных из Цюриха использовала нейросети для вывода физических законов на основе наборов данных. Их система, что-то вроде роботизированного Кеплера, заново открыла гелиоцентрическую модель Солнечной системы, исходя из записей местоположения Солнца и Марса в небе, видимых с Земли, а также вывела закон сохранения момента из наблюдений за столкновениями шаров. Поскольку физические законы часто можно выразить несколькими способами, исследователи интересуется, не сможет ли эта система предложить новые, и, возможно, более простые способы работы с известными законами.
Всё это примеры того, как ИИ ускоряет научные открытия, хотя в каждом случае можно поспорить, насколько революционным был новый подход. Возможно, наиболее спорным будет вопрос того, сколько информации можно получить из одних только данных — важный вопрос в эру необъятных, и постоянно растущих, гор данных. В книге The Book of Why 2018 года специалист по информатике Джади Пёрл и научно-популярный писатель Дана Макензи предполагают, что данные — вещь «невероятно тупая». На вопросы о причинно-следственных связях «никогда нельзя ответить исходя только из данных», пишут они. «Каждый раз, видя работу или исследование, анализирующее данные без учёта моделей, можно быть уверенным в том, что вывод этой работы суммирует, и, возможно, трансформирует, но не интерпретирует данные». Шавински симпатизирует позиции Пёрл, но описывает идею работы только лишь с данными, как нечто вроде «человечка из чёрточек». Он сказал, что никогда не заявлял о возможности выводить причины и следствия из данных. «Я просто говорил, что мы можем сделать с данными гораздо больше, чем это обычно бывает».
Ещё один частый аргумент заключается в том, что для науки нужно творчество, и, по крайней мере, пока что, мы вообще не представляем, как это запрограммировать. Простой перебор всех возможностей, как делал это робот-химик Кронина, не выглядит особенно творческим занятием. «Я думаю, для того, чтобы придумать теорию, логические построения, требуется творчество, — сказал Польстерер. — Каждый раз, когда нужно творчество, нужен человек». И откуда берётся творчество? Польстерер подозревает, что оно связано со скукой — тем, что, по его словам, машине испытывать не дано. «Чтобы быть творческим, нужно не любить скуку. А я не думаю, что компьютеру когда-нибудь станет скучно». С другой стороны, слова вроде «творчество» и «вдохновение» часто используются для описания таких программ, как Deep Blue and AlphaGo. А тщетные попытки описать, что творится внутри машинного разума, очень похожи на трудности, с которыми мы сталкиваемся, изучая наши собственные мыслительные процессы.
Шавинский недавно покинул академические круги в пользу коммерческого сектора; сейчас он руководит стартапом Modulos, где работают множество учёных из швейцарского технического института, и, согласно их сайту, «работает в глазу бури разработок в области ИИ и машинного обучения». Какие бы препятствия ни лежали между современным ИИ и полноценным искусственным разумом, он и другие эксперты считают, что машинам суждено делать всё больше и больше работы учёных. Есть ли тому пределы, нам только предстоит узнать.
«Будет ли возможно в обозримом будущем создать машину, способную делать открытия в физике или математике, на которые не способны умнейшие из живущих людей, использующие биологическое оборудование? — думает Шавинский. — Будет ли наука будущего развиваться благодаря машинам, работающем на недоступном нам уровне? Я не знаю. Это хороший вопрос».