[Перевод] Астрономы ускоряют поиск пригодных для жизни миров

Астрономы обнаружили тысячи планет, в том числе десятки потенциально пригодных для жизни. Чтобы отсеять их, необходимо изучить их атмосферы. В этом могут помочь искусственный интеллект и машинное обучение.

Астрономы обнаружили тысячи планет, в том числе десятки потенциально пригодных для жизни. Чтобы отсеять их, необходимо изучить их атмосферы. В этом могут помочь искусственный интеллект и машинное обучение.

Современной астрономии было бы трудно обойтись без ИИ и машинного обучения (МО), которые стали незаменимыми инструментами. Только они способны управлять и работать с огромными объёмами данных, которые генерируют современные телескопы. МО может просеивать большие массивы данных, выискивая в них закономерности, на поиск которых у человека ушло бы гораздо больше времени.

Поиск биопризнаков на землеподобных экзопланетах — важнейшая часть современной астрономии, и МО может сыграть в ней большую роль.

Поскольку экзопланеты так далеки, астрономы обращают пристальное внимание на те из них, которые позволяют проводить просвечивающую спектроскопию. Когда звёздный свет проходит через атмосферу планеты, спектроскопия позволяет разделить свет на различные длины волн. Затем астрономы исследуют свет на предмет наличия в нём признаков определённых молекул. Однако химические биосигнатуры в атмосферах экзопланет очень сложны, поскольку естественные небиологические процессы могут генерировать некоторые из тех же самых сигнатур.

Это модель спектра пропускания «Уэбба» для планеты, похожей на Землю. Здесь показаны длины волн солнечного света, которые поглощают такие молекулы, как озон (O3), вода (H2O), углекислый газ (CO2) и метан (CH4). Ось y показывает количество света, блокируемого атмосферой Земли, а не яркость солнечного света, проходящего через атмосферу. Яркость уменьшается снизу вверх. Понимание спектра Земли помогает учёным интерпретировать спектры экзопланет.

Это модель спектра пропускания «Уэбба» для планеты, похожей на Землю. Здесь показаны длины волн солнечного света, которые поглощают такие молекулы, как озон (O3), вода (H2O), углекислый газ (CO2) и метан (CH4). Ось y показывает количество света, блокируемого атмосферой Земли, а не яркость солнечного света, проходящего через атмосферу. Яркость уменьшается снизу вверх. Понимание спектра Земли помогает учёным интерпретировать спектры экзопланет.

Хотя этот метод является мощным, он сталкивается с некоторыми трудностями. Звёздная активность, такая как звездопады и вспышки, может загрязнять сигнал, а свет от атмосферы может быть очень слабым по сравнению со светом звезды. Если в атмосфере экзопланеты есть облака или дымка, это может затруднить обнаружение молекулярных линий поглощения в спектроскопических данных. Дополнительную сложность создаёт рэлеевское рассеяние, кроме того, может существовать несколько различных интерпретаций одного и того же спектроскопического сигнала. Чем больше этих типов «шума» в сигнале, тем хуже соотношение сигнал/шум. Зашумлённые данные — данные с низким соотношением сигнал/шум — представляют собой ярко выраженную проблему.

Мы все ещё открываем различные типы экзопланет и планетарных атмосфер, а наши модели и методы анализа не завершены. В сочетании с проблемой низкого соотношения сигнал/шум эта пара представляет собой серьёзное препятствие.

Но, как говорится в новом исследовании, тут может помочь машинное обучение. Работа «Машинная классификация потенциальных биосигнатур на землеподобных экзопланетах с использованием спектров передачи с низким отношением сигнал/шум» находится на рассмотрении в журнале Monthly Notices of the Royal Astronomical Society. Ведущий автор — Дэвид С. Дуке-Кастаньо из группы вычислительной физики и астрофизики Университета Антиокии в Медельине, Колумбия.

«Уэбб» — наш самый мощный инструмент для просвечивающей спектроскопии, и он даёт впечатляющие результаты. Но есть проблема: время наблюдений. Некоторые наблюдения требуют огромного количества времени. Для обнаружения таких вещей, как озон, может потребоваться непомерно большое количество транзитов. Если бы у нас было неограниченное количество времени для наблюдений, это не имело бы такого большого значения.

Одно исследование показало, что в случае TRAPPIST-1e для получения статистически значимых обнаружений может потребоваться до 200 транзитов. Число транзитов становится более разумным, если поиск ограничивается метаном и водяным паром. «Исследования показали, что при разумном количестве транзитов можно обнаружить присутствие этих атмосферных видов, которые обычно ассоциируются с глобальной биосферой», — пишут авторы. К сожалению, метан не является такой же надёжной биосигнатурой, как озон.

Учитывая время, необходимое для обнаружения некоторых из этих потенциальных биомаркеров, исследователи говорят, что, возможно, было бы лучше использовать «Уэбба» для проведения исследований по соотношению сигнал/шум. «Хотя это может не позволить получить статистически значимые результаты, это, по крайней мере, позволит планировать последующие наблюдения интересных целей с помощью нынешних и будущих более мощных телескопов (например, ELT, LUVOIR, HabEx, Roman, ARIEL)», — пишут авторы, ссылаясь на названия телескопов, которые находятся в стадии строительства или планирования.

Исследователи разработали инструмент машинного обучения, который поможет решить эту проблему. По их словам, он может ускорить поиск пригодных для жизни миров за счёт использования возможностей искусственного интеллекта. «В этой работе мы разработали и протестировали общую методологию машинного обучения, предназначенную для классификации спектров излучения с низким отношением сигнал/шум в соответствии с их потенциальной возможностью содержать биосигнатуры», — пишут они.

Поскольку большая часть данных спектроскопии атмосферы экзопланет представляет собой шум, инструмент МО предназначен для их обработки, определения уровня шума и классификации атмосфер, которые могут содержать метан, озон и/или воду или быть достаточно интересными для последующих наблюдений».

Команда создала миллион синтетических атмосферных спектров на основе известной планеты TRAPPIST-1 e, а затем обучила на них свои МО-модели. TRAPPIST-1e по размерам похожа на Землю и является скалистой планетой в обитаемой зоне своей звезды. «Система TRAPPIST-1 привлекла значительное внимание учёных в последние годы, особенно в области планетарных наук и астробиологии, благодаря своим исключительным характеристикам», — говорится в статье.

Изображение скалистой экзопланеты TRAPPIST-1e, похожей по размеру на Землю.

Изображение скалистой экзопланеты TRAPPIST-1e, похожей по размеру на Землю.

Звезда TRAPPIST-1 известна тем, что в ней находится наибольшее количество каменистых планет среди всех обнаруженных нами систем. По мнению исследователей, это идеальный кандидат для обучения и тестирования МО-моделей, поскольку астрономы могут получить благоприятные показания сигнал/шум за разумное время. Планета TRAPPIST-1e, вероятно, имеет компактную атмосферу, подобную земной. Полученные модели были успешными и правильно определяли спектры пропускания с подходящими уровнями SNR.

Исследователи также протестировали свои модели на реалистичных синтетических атмосферных спектрах современной Земли. Их система успешно определила синтетические атмосферы, содержащие метан и/или озон в соотношениях, аналогичных протерозойской Земле. В протерозое атмосфера претерпела фундаментальные изменения из-за кислородной катастрофы.

Она изменила всё. Она позволила сформироваться озоновому слою, создала условия для процветания сложной жизни и даже привела к образованию огромных залежей железной руды, которые мы добываем сегодня. Если на других экзопланетах развилась фотосинтетическая жизнь, их атмосферы должны быть похожи на земную атмосферу протерозоя, так что это релевантный маркёр для биологической жизни. (Недавнее открытие тёмного кислорода имеет серьёзные последствия для нашего понимания кислорода как биомаркера в атмосферах экзопланет).

В своей статье авторы описывают обнаружение кислорода или озона как «драгоценный камень» спектроскопических сигнатур экзопланет. Но существуют и абиотические источники, и то, являются ли кислород или озон биотическими, может зависеть от того, что ещё присутствует в сигнатуре. «Чтобы отличить биотический O2 от абиотического, можно искать специфические спектральные отпечатки», — пишут авторы.

Чтобы оценить эффективность своей модели, им нужно знать, какие атмосферы экзопланет определены правильно, а какие — ложно.

Результаты также должны быть классифицированы как истинно положительные или истинно отрицательные, по отношению к точности измерений, или ложно положительные или ложно отрицательные, то есть ошибки. Чтобы упорядочить данные, они создали систему классификации, которую назвали матрицей запутанности.

«На диаграмме мы ввели категорию «интересный», чтобы выделить планеты, которые заслуживают последующих наблюдений или углублённого анализа», — поясняют авторы. «Следует ещё раз напомнить, что в центре внимания данной работы находится не обнаружение биосигнатур с помощью МО, а маркировка планет, которые являются интересными или нет».

Матрица запутанности имеет четыре классификации – true positive, false negative, false positive, true negative

Матрица запутанности имеет четыре классификации — true positive, false negative, false positive, true negative

Одна из моделей успешно определила вероятные биосигнатуры в спектрах протерозойской Земли после единственного транзита. На основе проведённого тестирования они объясняют, что «Уэбб» успешно обнаружит большинство «обитаемых земных планет, наблюдаемых с помощью JWST/NIRSpec PRISM вокруг М-карликов, расположенных на расстояниях, близких или меньших, чем TRAPPIST-1 e». Если, конечно, они существуют.

Эти результаты могут помочь в дальнейшей работе «Уэбба». Исследователи пишут, что «стратегии с машинной поддержкой, подобные представленным здесь, могут значительно оптимизировать использование ресурсов «Уэбба» для поиска биосигнатур». Они могут упростить процесс и увеличить шансы на то, что последующие наблюдения обнаружат перспективных кандидатов. Телескоп работает уже два года и семь месяцев в рамках своей основной миссии, запланированной на пять с половиной лет. (Хотя в целом телескоп может проработать до 20 лет.) Всё, что может оптимизировать драгоценное время наблюдений космического телескопа, — это победа.

В целом, исследование представляет модель машинного обучения, которая может сэкономить время и ресурсы. Она быстро просматривает атмосферные спектры потенциально пригодных для жизни экзопланет. Хотя она не определяет, какие из них содержат биомаркеры, она может выявить лучших кандидатов для последующего наблюдения всего после 1–5 транзитов, в зависимости от типа атмосферы. Для некоторых типов потребуется большее количество транзитов, но модель всё равно экономит время.

«Идентификация планеты как «интересной» сделает распределение наблюдательного времени таких ценных ресурсов, как «Уэбб», более эффективным, что является важной целью в современной астрономии», — пишут они.

© Habrahabr.ru