Учёные из AIRI создали и выложили в открытый самую большую базу данных по квантовой химии

Учёные из Института Искусственного Интеллекта AIRI создали и выложили в открытый доступ крупнейший в мире набор данных по квантовой химии для расширения возможности исследований в области поиска новых материалов и разработки лекарств, сообщили Информационной службе Хабра в пресс-службе AIRI. Это исследование уже опубликовано в журнале Physical Chemistry Chemical Physics.

f7e900ab681801f51373db7ea5ba028c.png

Для применения методов ИИ в квантовой химии повсеместно, научному сообществу нужно большее количество специализированных данных. И как заявил руководитель научной группы «Глубокое обучение в науках о жизни» AIRI Артур Кадурин, подавляющее большинство исследований, недавно проведенных в этой области, ограничивается экспериментами на небольшом количестве структур разных веществ, это ставит под сомнение применимость моделей ИИ в реальных задачах индустрий. С целью решения этой проблемы ученые Института AIRI при поддержке «Сколтеха» и ПОМИ РАН собрали 5 340 152 конформаций для 1 004 918 подобных лекарствам молекул с их квантовыми свойствами, а потом выложили базу данных в открытый доступ на маркетплейс артефактов машинного обучения DataHub. Доступ к этому датасету возможен через платформу ML Space. 

Кроме того, в набор данных включили 4 модели для предсказания энергии молекулярной конформации и 2 модели для работы с теорией функционала плотности. Хотя получить модели, близкие к химической точности, все равно сложно, экспериментальные данные показывают, что большие наборы данных приводят к повышению качества моделей ИИ. Сейчас научная группа планирует дальше пополнять собранную базу.

© Habrahabr.ru