Искусственный интеллект научили восстанавливать молекулы по их фрагментам
Исследователи из Национальной ускорительной лаборатории SLAC в Калифорнии и их коллеги создали генеративную модель искусственного интеллекта MOLEXA (сокращение от Molecular Structure Reconstruction from Coulomb Explosion Imaging), которая способна восстанавливать молекулярные структуры на основе данных о движении ионов после их разрушения рентгеновскими лучами. Этот метод, известный как визуализация кулоновского взрыва, открывает новые возможности для изучения химических реакций.
Работа демонстрирует, как MOLEXA предсказывает геометрию молекул, состоящих из менее чем 10 атомов. Это важный шаг к применению метода для более сложных молекул, что может иметь значительное влияние на медицину и промышленность.
Традиционные методы, такие как электронная микроскопия, требуют фиксации молекул, что делает невозможным их изучение в свободном движении. Техника кулоновского взрыва позволяет анализировать изолированные молекулы, но её применение ранее ограничивалось вычислительными сложностями.
Иллюстрация: SLAC National Accelerator LaboratoryMOLEXA преодолевает эти ограничения. Модель была обучена на данных, полученных с помощью симуляций, которые анализировали молекулярные структуры и рассчитывали движение ионов после кулоновского взрыва. Двухэтапный процесс обучения, включающий как точные, так и более крупные, но менее точные наборы данных, позволил снизить ошибки предсказаний в 2 раза.
Модель была протестирована на экспериментальных данных, полученных на Европейском рентгеновском лазере (XFEL). Среди протестированных молекул были вода, тетрафторметан и этанол. Реконструированные структуры в основном совпадали с известными данными, демонстрируя высокую точность метода.
В будущем исследователи планируют расширить возможности MOLEXA для работы с более крупными молекулами и применять её для временных экспериментов, чтобы «создавать молекулярные фильмы, показывающие, как развиваются химические реакции». Это также поможет интерпретировать данные, полученные на высоких частотах рентгеновских импульсов.
Команда также изучает возможность реконструкции молекул из неполных данных, что сделает метод более универсальным. Например, модель может восстанавливать молекулы, даже если некоторые ионы не были зафиксированы детектором.
Если эти задачи будут решены, то методика найдёт применение в биологии и химии, включая изучение сложных белков, состоящих из тысяч атомов. Это откроет новые горизонты для исследований, связанных с биологически и промышленно значимыми системами.
© iXBT
