Создатели Pfizer объединились с программистами и создали нейросеть, предсказывающую опасные штаммы коронавируса
В ходе испытаний обе компании заявили, что их система раннего предупреждения смогла выявить 12 из 13 вариантов коронавируса, которые ВОЗ до сих пор определяла как потенциально опасные, причем с опрежением в несколько месяцев
Что касается варианта Omicron, система идентифицировала его как потенциально опасный в тот же день, когда его генетическая последовательность была впервые доступна, согласно статье BioNTech и InstaDeep, опубликованной в среду в не рецензируемом академическом репозитории bioRxiv.org.
«Раннее выявление потенциальных вариантов с высоким риском может быть эффективным инструментом для предупреждения исследователей, разработчиков вакцин, органов здравоохранения и политиков, тем самым предоставляя больше времени для реагирования на новые варианты, вызывающие озабоченность», — заявил Угур Сахин, соучредитель и главный исполнительный директор BioNTech.
Глобальный характер пандемии, легкая трансмиссивность вируса COVID-19 (SARS-CoV-2) и широкое использование геномного секвенирования завалили ученых данными. А поскольку вирус постоянно мутирует, постоянно обнаруживаются новые варианты, хотя подавляющее большинство этих новых вариантов не представляют повышенного риска и не создают проблем для существующих вакцин и методов лечения.
«Каждую неделю в настоящее время обнаруживается более 10 000 новых последовательностей вариантов, и люди-эксперты просто не могут справиться со сложными данными в таком масштабе», — заявил Карим Бегир, соучредитель и исполнительный директор InstaDeep.
Двойная система
Система, разработанная BioNTech и InstaDeep, работает двумя способами, и оба основаны на последовательности ДНК конкретного варианта вируса.
Первая часть системы предсказывает структуру шиповидного белка варианта на основе последовательности ДНК. Спайковый белок — это часть вируса, используемая для заражения клеток, а также часть, за которую прикрепляются антитела, чтобы вывести вирус из строя. Компания DeepMind написала алгоритм AlphaFold, доступной исследователям бесплатно — он помогает анализировать потоки данных.
Вторая часть системы берет последовательность ДНК и обращается с ней так, как если бы это был своего рода язык. Затем он использует ИИ-методы, которые были разработаны для обработки естественного языка, чтобы изучить, насколько последовательность ДНК для шиповидного белка конкретного варианта похожа на другие известные шиповидные белки коронавируса.
Почему это важно
В результате система выводит несколько ключевых характеристик, которым в дальнейшем присваивает общий рейтинг. Чем он выше — тем более пристальное внимание ученые обращают на ту или иную разновидность коронавируса. Оперативность играет в данном случае ключевую роль, ведь чем раньше исследователи начнут работу над новыми типами вакцин, тем выше вероятность того, что очередная вспышка заболевания не станет массовой.