Порядок из хаоса: новый алгоритм позволяет синтезировать «сложные» белки

Современные технологии искусственного интеллекта за последние годы совершили революцию в биологии: теперь компьютеры умеют «сворачивать» белки — то есть предсказывать их трехмерную структуру по аминокислотной последовательности. Специалисты Гарвардской школы инженерных и прикладных наук и Северо-Западного университета разработали новый метод машинного обучения — он позволяет проектировать особый класс белков, которые не поддаются даже самым мощным алгоритмам искусственного интеллекта, включая AlphaFold, принесший своим разработчикам Нобелевскую премию. Результаты исследования опубликованы в Nature.
Речь идет о так называемых «внутренне неупорядоченных белках» (intrinsically disordered proteins, сокращенно IDPs), которые составляют около 30% всех белков человеческого организма. В отличие от обычных белков с фиксированной трехмерной структурой, эти молекулы постоянно меняют свою форму, находясь в непрерывном движении. Несмотря на кажущийся хаос, они выполняют важнейшие биологические функции: связывают молекулы, передают сигналы и являются частью рецепторов.

Кришна Шринивас, бывший научный сотрудник Гарварда, а ныне доцент Северо-Западного университета, отметил, что ученые кровно заинтересованы в изучении внутренне неупорядоченных белков, потому что они находятся вне досягаемости современных методов на основе ИИ, таких как AlphaFold от Google DeepMind.
Важность этих белков трудно переоценить. Мутации в IDPs связаны с серьезными заболеваниями, включая рак и нейродегенеративные расстройства. Классический пример — альфа-синуклеин, белок, который специалисты уже давно связывают с болезнью Паркинсона. Однако нестабильная природа молекул делала невозможным проектирование таких белков с нуля для терапевтических или исследовательских целей.
Команда применила инновационный подход, используя алгоритмы автоматического дифференцирования — технологию, которая широко применяется в глубоком обучении для тренировки нейронных сетей. Майкл Бреннер, профессор прикладной математики и физики в Гарварде, был одним из первых, кто увидел потенциал этой технологии за пределами машинного обучения.
Мы не хотели просто брать кучу данных и обучать модель проектировать случайные белки. Мы использовали существующие, достаточно точные симуляции, чтобы проектировать IDPs на уровне этих симуляций.Райан Крюгерсоавтор исследования, аспирант Гарварда.
Метод позволяет компьютеру распознавать, как малейшие изменения в белковых последовательностях — даже замена одной аминокислоты — влияют на конечные свойства белков. Исследователи сравнивают свой метод с мощной поисковой системой для аминокислотных цепочек, которая находит именно те комбинации, которые необходимы для выполнения конкретной функции.
Ключевое преимущество нового подхода заключается в том, что IDPs проектируются не по предсказаниям ИИ, а на основе симуляций молекулярной динамики с использованием реальной физики. Такой метод учитывает, как белки действительно ведут себя в природе, а не просто предполагает их структуру.
Разработка ученых обещает в будущем прорывы в лечении заболеваний, связанных с неупорядоченными белками. Метод также может найти применение в синтетической биологии для создания новых материалов и терапевтических агентов с уникальными свойствами.

Конструирование биомолекул — вовсе не прихоть ученых. Оно в прямом смысле приносит ценные плоды. Недавно мы написали о том, как алгоритм AlphaFold помог картофелю и томатам справиться с беспощадной бурой гнилью.

