[Из песочницы] Быстрое обнаружение сверхновых с помощью нейронных сетей
Привет, Хабр! Хочу познакомить вас с переводом (немного адаптированным) замечательной статьи «Fast Supernovae Detection using Neural Networks» Родриго Карраско-Дэвиса из института астрофизики в Чили.
Немного предыстории
Астрономия — это изучение небесных объектов: звёзды, галактик или чёрных дыр. Такое изучение небесных объектов напоминает работу в лаборатории «природной физики». В ней происходят самые невероятные, экстремальные природные процессы, которые в большинстве своём невозможно повторить на Земле. Наблюдения за этими процессами позволяют нам глубже познать мир, проверить существующие знания о физике, сравнивая устоявшиеся представления с тем, что мы наблюдаем во Вселенной.
Существует особый тип событий, крайне интересный астрономам. Он случается в конце жизни массивных звёзд. Они состоят из водорода, который под воздействием силы тяжести стягивается к центру. И, когда плотность становится достаточно высока, начинается слияние атомов водорода. Это приводит к возникновению свечения и появлению новых химических элементов: гелия, углерода, кислорода, неона и т.д. Процесс слияния происходит под внешним давлением, тогда как гравитация оказывает давление внутреннее, тем самым поддерживая стабильность звезды, пока она сжигает саму себя. Чем массивнее звезда, тем больших температур достигает её ядро, и тем быстрее она сжигает ядерное топливо.
Постепенно процесс синтеза переходит на более тяжёлые элементы: к магнию, кремнию, сере, приходя в итоге к железу, кобальту и никелю. Синтез дальнейших элементов потребовал бы больше энергии, чем выделяется при реакции, поэтому ядро схлопывается и происходит взрыв сверхновой.
Крабовидная туманность, остаток сверхновой
Этот процесс очень важен для астрономов. Из-за экстремальных условий во время взрыва астрономы могут наблюдать синтез тяжелых элементов, проверять поведение вещества при интенсивном давлении и температуре, а также наблюдать продукт взрыва, которым может быть нейтронная звезда или чёрная дыра.
Сверхновые также можно использовать как стандартные свечи. Типичная проблема в астрономии: измерение расстояний до небесных объектов. Поскольку звезды очень далеки от Земли, трудно определить, является ли звезда слабой и близкой к нам или же очень далёкой и очень яркой. Большинство взрывов сверхновых во Вселенной происходит одинаково, поэтому астрономы используют сверхновые для измерения расстояний, что важно при изучении, например, расширения Вселенной и тёмной энергии.
Несмотря на то, что вспышки сверхновых очень яркие, их трудно заметить из-за их удалённости от Земли, из-за их низкой частоты возникновения (примерно одна сверхновая на галактику в столетие) и кратковременного характер взрыва, который может длиться от нескольких дней до пары недель. Кроме того, чтобы получить полезную информацию от сверхновой, необходимо подготовить спектрограф (используется для измерения энергии, испускаемой во время взрыва на нескольких частотах). Также было бы хорошо начать наблюдать за звездой заранее, так как многие интересные физические процессы происходят в течение нескольких часов с начала взрыва. А теперь задайте себе вопрос: как мы можем быстро найти эти взрывы сверхновых среди всех других наблюдаемых астрономических объектов во Вселенной?
Астрономия сегодня
Несколько десятилетий назад астроном должен был выбрать определённый объект и навести на него телескоп, чтобы получить нужную ему информацию. Современные телескопы вроде Цвикки (Zwicky Transient Facility, ZTF) или обсерватория имени Веры Рубин делают качественные изображения неба с очень высокой скоростью, собирая данные о видимом небе каждые три дня. Телескоп ZTF генерирует 1,4 ТБ данных за ночь, идентифицируя и отправляя информацию об интересных изменяющихся объектах в небе в режиме реального времени.
Когда что-то меняет свою яркость, «умные» телескопы это замечают и передают оповещение-предупреждение. Предупреждение выполняется путём отправки потока данных, в котором каждое сообщение состоит из трех обрезанных изображений размером 63 на 63 пикселя. Эти три изображения называются научным, эталонным и разностным.
Файл с научным изображением — это результат самого последнего наблюдения за конкретной областью. С эталонным — то, что было в начале наблюдений. Всё, что изменилось между первым и вторым изображениями, видно на третьем, разностном. Пресловутый телескоп передаёт до одного миллиона предупреждений за ночь, но чаще — несколько тысяч. Допустим, человек хочет проверять каждое предупреждение вручную, на просмотр всех предупреждений за одну ночь потребуется примерно 3,5 дня.
Научное, эталонное и разностное изображения. Дополняются другими важными данными, такими как условия наблюдения и информация об объекте. Четвертое изображение — это цветная версия отPanSTARRS с использованиемAladin Sky Atlas. Вы можете увидеть полную эволюцию яркости сверхновой во времени в интерфейсеALeRCE.
Поскольку эти предупреждения сообщают обо всем, что меняется на небе, важно иметь возможность обнаруживать сверхновые среди всего потока информации, генерируемой телескопом. Проблема в том, что другие астрономические объекты также могут стать причиной создания оповещения. Например, меняющие свою яркость переменные звёзды, активные ядра галактик, астероиды. Случаются и просто ложные предупреждения. К счастью, у научных, эталонных и разностных изображений есть ряд отличительных особенностей, которые помогают определить, что в оповещении говорится о сверхновой или другом объекте. И было бы здорово научиться эффективно различать основные классы предупреждений.
Пять классов астрономических объектов
Так, активные ядра галактик обычно располагаются в центре галактик. Сверхновые обычно возникают вблизи родительской галактики. Астероиды наблюдаются около Солнечной системы, и они не видны на эталонном изображении. Переменные звезды встречаются на изображениях, заполненных другими звездами, поскольку они находятся в основном в пределах Млечного Пути. Ложные оповещения возникают по разным причинам: недостаток пикселей в камере телескопа, плохое вычитание при создании разностного изображения, космические лучи и т.д. Как я уже говорил, человеку не под силу вручную проверить каждое предупреждение. Поэтому был нужен автоматический способ их классификации, чтобы астрономы могли наиболее интересные данные, в которых с большей вероятностью содержится информация о сверхновых.
Поиск сверхновых с помощью нейронных сетей
Так различия между изображениями пяти вышеупомянутых классов мы примерно понимаем, то можно попробовать вычислить конкретные особенности, чтобы правильно их классифицировать. Однако ручная работа сложна, требует долгого периода проб и ошибок. Поэтому было решено обучить свёрточную нейронную сеть (CNN) для решения проблемы классификации и быстрого обнаружения сверхновых.
Обеспечение инвариантности нейронной сети достигается путем создания повёрнутых на 90° копий каждого изображения в обучающем наборе, после чего загружается среднее значение каждой повернутой версии изображения. Применение инвариантности важно, так как не существует определенной ориентации, в которой структуры могут появляться на изображениях, присылаемых в оповещениях.
Также учёные добавили часть метаданных, содержащихся в предупреждении, таких как положение в координатах неба, расстояние до других известных объектов и метрики атмосферных условий. После обучения модели с использованием кросс-энтропии вероятность того, что в предупреждении содержится информация о сверхновой, сконцентрировалась вокруг значений 0 или 1. Правда, классификатор иногда ошибался в предсказанном классе. Не очень-то удобно, что исследователю приходится дополнительно фильтровать данные о возможных сверхновых после того, как компьютер сделал прогноз.
Чтобы максимизировать энтропию прогноза и распределить значения выходных вероятностей, учёные добавили в нейросеть дополнительную информацию. Это позволило улучшить детализацию или четкость прогнозов, получая вероятности во всем диапазоне от 0 до 1, а не только крайние значения этих показателей. Получились гораздо более удобно интерпретируемые прогнозы, позволяющие астроному выбирать стоящих кандидатов в сверхновые.
Свёрточная нейронная сеть с повышенной инвариантностью вращения. Повернутые копии создаются и передаются в одну и ту же архитектуру нейросети, чтобы затем применить средний пул в плотном слое перед объединением с метаданными.
Учёные пропустили через нейросеть порядка 400 000 объектов, равномерно распределённых в пространстве по всему охвату телескопа ZTF, в качестве проверки корректности прогнозов модели. Оказалось, что каждый класс, предсказанный нейросетью, пространственно распределён. Это логично, если учитывать природу каждого астрономического объекта. Например, активные галактические ядра и сверхновые в основном находятся за пределами плоскости Млечного Пути (внегалактические объекты), поскольку маловероятно, что дальнейшие объекты можно будет увидеть через плоскость Млечного Пути из-за окклюзии. Модель правильно предсказывает меньшее количество объектов вблизи плоскости Млечного Пути (галактические широты ближе к 0). Переменные звёзды правильно обнаруживаются с более высокой плотностью в плоскости Галактики. Астероиды находятся около плоскости Солнечной системы, также называемой эклиптикой (отмеченной желтой линией). А ложные предупреждения случаются повсюду.
Информации в изображениях (научных, эталонных и разностных) достаточно для получения хорошей классификации в обучающем наборе, но интеграция информации из метаданных была критичной для получения правильного пространственного распределения прогнозов.
Пространственное распределение немаркированного набора астрономических объектов. Каждый график дан в галактических координатах. Галактическая широта находится в центре Млечного Пути, поэтому широты, близкие к 0, также ближе к плоскости Млечного Пути. Галактическая долгота указывает, какую часть диска мы видим в плоскости Млечного Пути. Желтая линия представляет собой плоскость солнечной системы (эклиптику).
Охотники за сверхновыми
Веб-интерфейс получившегося проекта Supernova Hunter позволяет астрономам изучать объекты, выбранных нейронной сетью, будучи уверенными в том, что они являются сверхновыми. Они также могут сообщить о неправильной классификации, сделанной моделью, что позволяет добавить новую информацию в обучающий набор, чтобы позже улучшить работу нейросети.
Supernova Hunter: пользовательский интерфейс для исследования кандидатов в сверхновые. Он показывает список оповещений, в которых с высокой вероятностью есть информация о сверхновой. Для каждого из них добавлены изображения, положение объекта и метаданные.
С помощью классификатора нейронной сети и Supernova Hunter удалось подтвердить 394 сверхновые и сообщить о 3060 кандидатах в сверхновые на Transient Name Server с 26 июня 2019 г. по 21 июля 2020 г. В среднем выходило 9,2 кандидатов в сверхновые в день. Такой темп наблюдений резко увеличивает количество доступных сверхновых, которые можно изучать на ранних стадиях взрыва.
Перспективы
Сейчас учёные, создавшие Supernova Hunter, работают над улучшением классификационных характеристик модели, чтобы она точнее находила кандидатов в сверхновые и требовала меньше внимания со стороны человека. В идеале это должна быть система, которая способна автоматически сообщать о каждом возможном кандидате в сверхновую с высокой степенью уверенности.
Ещё одним направлением работы учёных является поиск редких объектов с использованием методов обнаружения выбросов. Это сложная, но реальная задача, так как новые телескопы теоретически могут открыть новые виды астрономических объектов из-за невероятной частоты дискретизации и масштабности каждого наблюдения
Новый способ анализа огромных массивов астрономических данных будет не только полезным, но и необходимым, так как организация классификация и перераспределение данных важная часть науки. Использование современных мощных телескопов коренным образом меняет способ изучения астрономами небесных объектов, и учёные должны быть готовы к работе с новыми технологиями.
Спасибо за внимание! Оригинал статьи.