Почему огромная база из 370 000 белков, созданная нейросетью, может изменить фундаментальную науку

25.07.2021, 19:31
Ученые обнародовали самую исчерпывающую базу данных о белках, которые формируют «строительные блоки» жизни, что должно «коренным образом изменить образ биологических исследований».
Василий Макаров
Почему огромная база из 370 000 белков, созданная нейросетью, может изменить фундаментальную науку

Нейросеть за пару часов удвоила результаты работы, на которую исследователи потратили больше 50 лет

Каждая клетка в каждом живом организме начинает выполнять свои функции только по команде белков, которые постоянно доставляют организму самые разные инструкции — от поддержания здоровья до борьбы с инфекцией. В отличие от генома (полной последовательности генов человека, кодирующих клеточную жизнь) протеом человека (то есть совокупность белков) постоянно изменяется в ответ на генетические «инструкции» и стимулы окружающей среды.

Понимание того, как работают белки внутри клеток, было и остается одной из главных целью ученых на протяжении десятилетий. Однако определение точной функции каждого белка с помощью прямых экспериментов — дело кропотливое.

За пятьдесят лет исследований было изучено только 17% аминокислот (то есть субъединиц белков) протеома человека. Но недавно исследователи из Google DeepMind и Европейской лаборатории молекулярной биологии (EMBL) обнародовали базу данных из 20 000 белков, экспрессируемых геномом человека, которая находится в свободном и открытом доступе в Интернете.

В набор также включены более 350 000 белков из 20 организмов, таких как бактерии, дрожжи и мыши, на которых ученые чаще всего полагаются в своих исследованиях.

Для создания базы данных команда использовала современную программу машинного обучения, которая смогла точно предсказать форму белков на основе их аминокислотных последовательностей. Вместо того, чтобы тратить месяцы на оборудование стоимостью в несколько миллионов долларов, они обучили свою систему AlphaFold работе с базой данных из 170 000 известных белковых структур.

Затем ИИ использовал алгоритм для точного предсказания формы 58% всех белков в протеоме человека. Это более чем вдвое увеличило количество высокоточных белковых структур нашего организма. Результаты полувековых экспериментов, по сути, были удвоены в одночасье.

Возможности применения новой базы огромны: от исследования генетических заболеваний и борьбы с противомикробной устойчивостью до создания более засухоустойчивых культур. Ученые уверены, что в будущем такой мощный инструмент полностью изменит сам подход к исследованиям биологических аспектов жизни на нашей планете.

©  Популярная Механика