[Перевод] Химики проверяют ретросинтетические пути, полностью предсказанные алгоритмами ИИ
Впервые, насколько мне известно, когда компьютерная программа предсказывает синтез и вы идете в лабораторию — бац! —, а оно работает
— так описывает свою программу Chematica Бартош Гжибовский.
Предыстория
Идея компьютерного планирования химических синтезов далеко не нова. Элиас Дж. Кори из Гарвардского университета разработал первую версию такой программы (Logic and Heuristics Applied to Synthetic Analysis), в 1970-х годах, но она никогда не оправдала возложенных на нее надежд. Chematica является одним из нескольких новых соперничающих программных продуктов, которые появились за последние пару лет. Бартош Гжибовски (Bartosz Grzybowski, Ульсанский национальный институт науки и техники, Южная Корея и Польская академия наук) работал над программой в течение 15 лет, прежде чем продавать ее MilliporeSigma в мае 2017 года.
Обычно, химики целиком полагаются на свой опыт и знания — химическую интуицию — для разработки последовательности реакций, которая должна приводить к большой молекуле из более маленьких молекул-блоков. Также химики должны учитывать различные ограничения, такие как несовместимость функциональных групп в определенных условиях реакций.
Chematica успешно спрогнозировала пути синтеза восьми синтетически сложных молекул и в ряде случаях смогла улучшить выходы продуктов реакции.
Планировать ретросинтез, согласно Гжибовски, это как играть в шахматы: есть некоторое количество основных ходов. В ходе игры, каждый ход открывает новую ветку для получения уже другого результата. Но в органическом синтезе «количество основных шагов — основные типы реакций — просто огромен». После каждого синтетического хода, возникает выбор из около сотни последующих возможных шагов. Это означает, что чем больше стадий синтеза, тем более впечатляющ набор возможных шагов.
Но химики предвзяты, объясняет Сара Трис (Sarah Trice, руководитель отдела коммерческого развития технологий хеминформатики из MilliporeSigma — компании недавно купившей Chematica), то есть есть тенденция использовать то что было успешным в прошлом. Гжибовский считает, что Chematica устранит предвзятость. Алгоритм Chematica был обучен более чем 50,000 правил в течении последних 15 лет, также как и средства поиска вариантов в этом огромном химическом космосе и разработки нужных последовательностей реакций.
Испытания
Несмотря на привлекательность концепта, не было никаких данных для подтверждения, что он действительно работает. Но теперь Chematica доказала значимость в лабораторных испытаниях. Алгоритм нашел важные пути для восьми молекул: шесть малых биологически активных соединений, один медикамент-блокбастер и одну молекулу природного соединение.
Раннее предложенные пути для большинства из этих шести лекарственных соединений имели проблемы с низким выходом продуктов, а часть из них вообще не была синтезирована. Chematica разработала пути с менее чем 10 синтетическими шагами, используя только обычные реагенты. Тем не менее, команда смогла получить целевые продукты с высокими выходами — в некоторых случаях от 1% до 60% — при этом сэкономив время и деньги на лабораторные исследования, по сравнению с предыдущими попытками.
Некоторые из ретросинтетических расчленений программы были необычными — такие как трехкомпонентная аза-Генри реакция в одном из путей к одному стереоизомеру хинолон-сочлененного лактама. «Химикам было необычно проводить некоторые стадии синтеза, так как их чутье, подсказывало им, что здесь может не получиться», смеется Трис. Гжибовский рассказывает, что «правила игры были такими: вы не можете изменить ретросинтетические расчленения и вам нужно следовать общей методологии».
Ограничения
Так как Chematica не дает точных условий для каждой реакции, все есть необходимость идти путем проб и ошибок, когда дело касается оптимизации синтеза. Однако, для реалистичности время и финансы были ограничены пятью попытками для каждой реакции и максимума в 70 часов для проведения каждого полного синтеза.
Лекарство-блокбастер против аритмии препарат дронедарон (dronedarone) служил примером другой проблемы: его синтез защищен 46-ю патентами.
Chematica сумела спланировать синтез лекарственного препарата донедарону против антиаритмии, который избегал всех вариантов защищенных патентами. Программа также умеет учитывать стоимость реагентов для производства и выбирать более дешевые пути синтеза.
Ричмонд Сарпонг (Richmond Sarpong, Калифорнийский университет, Беркли) и его научная группа тоже получила шанс протестировать новый инструмент. «Мы были очень впечатлены возможностями. Алгоритм особенно эффективен в поиске решений определенных структурных фрагментов. В этой части нахожу, что программа более способна, по сравнению с человеком».
Тем не менее, Сарпонг указывает, что «как и люди, программа пытается предсказывать с участием архитектурно сложных молекул, где возникают стереоэлектронные тонкости». Группа Сарпонга в настоящее время работает над одним из синтетических путей, предсказанных Chematica.
Гжибовский считает, что следующим этапом будут сложные природные соединения. Его команда завершает 15-ступенчатый синтез недавно выделенного природного алкалоида. «Я никогда не считал себя очень компетентным органических химиком. Это первый полный синтез в моей жизни», — говорит он. «Я считаю, что это действительно способно помочь людям, которые не получили классической подготовки химика-синтетика», — добавляет Трис.
Гжибовский с готовностью отмечает, что Chematica не должна рассматриваться как угроза для опыта химиков. Поскольку алгоритм не может научить себя новым реакциям, «нам все еще нужны смелые химики-органики, готовые бросить вызов таким программам как Chematica и найти нетрадиционные способы создания молекул», — соглашается Мариола Тортоса (химик-органик, специализируется на синтезе природных соединений в университете Мадрида, Испания). «Тем не менее, программа может значительно ускорить [ретроинтеза]», — говорит она.
Джон Максвелл, вице-президент по химии в Tango Therapeutics, считает, что эта статья не доказывает, что Chematica планирует синтезы лучше, чем химики. Он указывает, что химики, синтезы которых выбраны для сравнения, не обязательно оптимизировали синтезы для выхода продукта или длины цепочки реакций.
Часть химиков задается вопросом, как Chematica и MilliporeSigma будут решать вопросы интеллектуальной собственности. Ричмонд Сарпонг, говорит, что исследователи могут не решаться использовать Chematica, так как не ясно, какой доступ будет у компании к молекулам, которые вводят пользователи или кто будет владеть интеллектуальной собственностью синтетических путей, которые генерирует Chematica. Сара Трис, поясняет, что целевые молекулы может видеть только пользователь, и что MilliporeSigma не будет контролировать интеллектуальную собственность вариантов синтеза, предлагаемых Chematica.
Компания уже работает с промышленными и академическими партнерами для тестирования программного обеспечения и надеется выпустить коммерческую версию в конце этого года.
Исходная статья в открытом доступе. 10.1016/j.chempr.2018.02.002
Кому интересно, тут можно прочитать, как планируют ретросинтез.
Перевод не дословный. Некоторые абзацы сокращены.
- В предысторию добавлен абзац из новости https://cen.acs.org/articles/96/i10/Chemists-test-computer-planned-syntheses.html.
- Добавлено еще два абзаца с комментариями в конце поста.
- Добавил видео.