Программирование и ДНК

67f039ad6ad3d4406e5a5e65305402ae.jpg

ДНК, или дезоксирибонуклеиновая кислота — молекула, содержащая генетическую информацию, которая обеспечивает жизнедеятельность, рост, развитие и размножение всех организмов. ДНК есть во всех земных формах жизни, кроме некоторых видов вирусов, у которых геном состоит из РНК. ДНК это одна из трех основных макромолекул в живых клетках, две другие — РНК и белки. Синтез белков невозможен без биологической информации, которая хранится в ДНК, а репликация (или копирование, самоудвоение) ДНК невозможна без сложного комплекса белков-ферментов, и то же самое можно сказать о синтезе РНК, матрицей которого выступает ДНК и в редких случаях — другая РНК, но всегда при участии белков.

60ae6f6d308b889ebd4c782a28eeb0ae.gif

Но при чем здесь программирование? На самом деле сходство есть. Например, точная последовательность нуклеотидов в цепях РНК и ДНК, единственная ошибка в которой может привести к отказу в работе всей молекулы, наводит на мысль о схожести устройства нуклеиновых кислот с компьютерной программой, которая может «упасть», если в ее коде всего в одном месте проставлен неверный символ.

Рассмотрим в качестве примера трансляцию по матрице мРНК (матричной, или информационной РНК) — процесс синтеза белка с учетом заложенной в РНК информации, которая в свою очередь, получена от ДНК. Процесс укладывается в повторяющиеся друг за другом три стадии, а именно инициацию, элонгацию и терминацию, и представляет собой типичный многоуровневый цикл. Подобные циклы легко укладываются в алгоритмы, а соответственно, могут быть записаны на большинстве современных языков программирования.

Схема синтеза белкаСхема синтеза белка

В центре схемы изображена мРНК, которая недавно образовалась путем копирования определенного участка ДНК при участии белков-ферментов и имеет всю необходимую информацию о том куда она отправляется, какие белки надо синтезировать, как именно это надо сделать, механизм защиты от ошибок и так далее. Какая программа в нее заложена? В примитивном виде можно ее можно изложить так: ЕСЛИ рибосома (рибосома — макромолекула, которая собирает белок на матрице, или инструкции РНК) встречает при движении вдоль мРНК стартовый кодон (триплет АУГ), ТО прикрепить к большой субъединице рибосомы аминокислоту метионин И затем НАЧАТЬ цикл сборки. Сместить рибосому вдоль мРНК, и ЕСЛИ рибосома встречает при движении вдоль мРНК кодон, соответствующий определенной аминокислоте, ТО прикрепить к большой субъединице рибосомы эту аминокислоту, ИНАЧЕ ЕСЛИ рибосома встречает при движении вдоль мРНК стоп-кодон, ТО открепить цепь белка от рибосомы и ЗАВЕРШИТЬ цикл.

Это, конечно, очень упрощенная схема, в реальности условий и возможных вариантов развития событий намного больше, но — важный момент — все они заранее предусмотрены, то есть эта программа никогда не «падает». Например, в теле цикла необходимо подробно описать сравнение антикодона текущей тРНК с текущим кодоном мРНК; описать диссоциацию рибосомных субъединиц и что делать в случае, если стоп-кодон так и не повстречался; задать возможность прохождения по одной мРНК нескольких рибосом одновременно — на самом деле, пунктов очень большое количество, однако все они могут быть включены в код программы посредством вложенных циклов с условием или каких-то более сложных операций.

407227096333f02bea3e08c6bd96192d.png

С подобной же идеей можно «разложить» в программный код и другие явления: репликацию, транскрипцию, процесс прикрепления аминокислот к тРНК, расщепляющие функции малых интерферирующих РНК, работу R-плазмид или систем CRISPR-Cas. Этапы процедуры, а также ее завершение также определяются исключительно информацией, заложенной в коде соответствующих РНК и ДНК. То есть программный код уже написан, молекулы работают строго по нему. В человеческом организме около 30 триллионов клеток, и в каждой их них постоянно происходит множество таких процессов по заложенным в них инструкциям, или программам.

ДНК-компьютер

В 1994 году Леонард Адлеман, профессор университета Южной Калифорнии, продемонстрировал, что с помощью пробирки с ДНК можно весьма эффективно решать классическую комбинаторную «задачу о коммивояжере» (кратчайший маршрут обхода вершин графа). Классические компьютерные архитектуры требуют множества вычислений с опробованием каждого варианта. Эта задача относится к числу трансвычислительных: уже при относительно небольшом числе городов (66 и более) она не может быть решена методом перебора вариантов никакими теоретически мыслимыми компьютерами за время, меньшее нескольких миллиардов лет.

Леонард АдлеманЛеонард Адлеман

Метод же ДНК позволяет сразу сгенерировать все возможные варианты решений с помощью известных биохимических реакций. Затем возможно быстро отфильтровать именно ту молекулу-нить, в которой закодирован нужный ответ.

Это, однако, не означает, что с использованием биокомпьютеров не возникает никаких трудностей. Проблемы, возникающие при этом:

1) Требуется чрезвычайно трудоёмкая серия реакций, проводимых под тщательным наблюдением.

2) Существует проблема масштабирования задачи.

Биокомпьютер Адлемана отыскивал оптимальный маршрут обхода для 7 вершин графа. Но чем больше вершин графа, тем больше биокомпьютеру требуется ДНК-материала.

В 2002 году исследователи из Института Вейцмана в Израиле представили программируемую молекулярную вычислительную машину, состоящую из ферментов и молекул ДНК. В 2004 году специалисты из Института Вейцмана сообщили в авторитетном научном журнале «Nature» о создании ДНК-компьютера с модулем ввода-вывода данных.

В марте 2013 года исследователи создали транскриптор (биологический транзистор).

В 2019 группа молекулярных биологов из Рочестерского университета создали на основе ДНК вычислительную систему, способную извлекать квадратные корни из 10-битных чисел. В том же году в журнале «Nature» была опубликована статья, авторы которой описали созданный в Калифорнийском университете программируемый ДНК-компьютер и показали, что с помощью простого триггера один и тот же базовый набор молекул ДНК способен реализовать множество различных алгоритмов.

Краткий принцип работы ДНК-компьютеров. Нити ДНК имеют в своём составе четыре азотистых основания: цитозин, гуанин, аденин, тимин. Их последовательность кодирует информацию. С помощью ферментов эту информацию можно изменять: полимеразы достраивают цепочки ДНК, а нуклеазы их разрезают и укорачивают. Некоторые ферменты способны разрезать и соединять цепи ДНК в местах, указываемых другими ферментами — лигазами. Таким образом, ДНК-компьютеры могут хранить и обрабатывать информацию. Также в них присутствует то, что можно назвать многопоточностью — химические реакции на разных частях молекул проходят независимо, параллельно, что обеспечивает высокую скорость вычислений.

ДНК-нанороботы

Поговорим теперь про ДНК-роботов в живом организме. Работу программируемых нанороботов начали тестировать с начала 2010-х годов. Например, в 2014 году коллектив ученых из Израиля и США поставил эксперимент — запустил нанороботов в живых тараканов и показал эффективную работу созданных ими конструкций. На деле они создали логические схемы, реализующие разные исходы в зависимости от молекулярного окружения. Нанороботы — это специальным образом сконструированные объекты нанометрового масштаба, состоящие из различных молекул или даже отдельных атомов и выполняющие заранее заданные программируемые операции. В большинстве своем они представляют собой простейшие молекулярные машины, способные выполнять небольшой набор элементарных действий, — например, движение в заданном направлении, перенос груза и сенсорные функции. В своей работе ученые сконструировали три типа нанороботов: эффекторный робот, который нес в себе в качестве груза антитело, специфически связывающееся с клетками гемолимфы тараканов, и два робота-регулятора — позитивный и негативный. При помощи этих элементов, взаимодействующих между собой и с веществами в окружающей среде, ученым удалось собрать набор логических вентилей. Работа трех нанороботов приводила к реализации двух исходов — выпускать молекулярный груз или не выпускать. Для решения более сложных задач авторы использовали дополнительных эффекторных роботов. Такое решение позволило строить гораздо более сложные логические схемы. Исследователи утверждают, что при добавлении дополнительных эффекторных роботов и специальных регуляторов, ничто не мешает данной технологии превысить мощность старых 8-битных компьютеров Commodore 64 и Atari 800, на которых они играли в детстве.

Интересная перспектива использования описанных нанороботов — это создание «умных» лекарств. Запущенная в кровеносное русло команда нанороботов, в зависимости от программы и присутствующих в крови веществ (молекул, вирусов, бактерий и т.д.), сама поставит диагноз и выпустит необходимые лекарственные препараты. Для здорового человека такое лекарство будет совершенно безвредным, ведь, не обнаружив патогенов, нанороботы оставят молекулярный груз при себе. Возможен сценарий адресной доставки лекарств к определенному органу и последующее выведение лишних ДНК-роботов из организма. К несомненным плюсам таких лекарств относится возможность раннего обнаружения, например, единичных вирусов, и незамедлительное их уничтожение, а также низкая токсичность такой терапии. Сегодня уже существуют ДНК-роботы, которые успешно доставляют лекарства в раковые клетки.

В 2021 году в США появилось программное обеспечение для быстрого создания ДНК-роботов. Инженеры из Университета штата Огайо разработали программу MagicDNA, существенно ускоряющую создание ДНК-роботов. Благодаря новому ПО процесс, на который ранее уходило несколько дней, занимает всего несколько минут. Предполагается, что нанороботы будут производить микроскопическую электронику, находить в организме патогенные микроорганизмы или доставлять лекарства до цели внутри тела.

Запись информации в ДНК

В последние годы инженеры стали всерьез интересоваться ДНК как потенциальным носителем информации. Основными преимуществами такого способа хранения являются долговечность (в необходимых условиях ДНК может храниться тысячи лет, например ученые извлекают и секвенируют ДНК из давно погибших и окаменевших организмов) и высокая плотность записи. Кроме того, ДНК очень легко размножить — в бактериальных клетках или в пробирке при помощи полимеразной цепной реакции можно за короткое время сделать миллионы копий.

В 2012 году группа под руководством молекулярного биолога Джорджа Чёрча закодировала в ДНК книгу объемом в 52 тысячи слов, несколько картинок и одну программу, написанную на Java. Плотность информации оказалась равна почти 1018 байт, или миллион терабайт, на 1 грамм молекул. Для сравнения: жесткий диск объемом 1012 байт, или один терабайт, весит около сотни граммов.

В январе 2013 года исследователи записали в ДНК-коде несколько фотографий JPEG, набор шекспировских сонетов и звуковой файл. Прочтение последовательностей ДНК и обратная расшифровка кода показали, что информацию можно извлечь с практически 100-процентной точностью. В марте 2017 года журнал «Science» опубликовал статью американских ученых, которым записали 2×1017 байт на один грамм ДНК. Биологи подчеркивают, что не потеряли ни байта. Говоря проще, что записали, то и получили на выходе. Теоретически, эта схема способна масштабироваться в пределах, превышающих объёмы всей существующей цифровой информации, пишут авторы исследования.

e537b5684aa27d2abfff51766166e9b7.jpg

Однако у этого перспективного метода есть и свои недостатки, главный из которых — технически сложный и дорогой синтез и расшифровка последовательностей ДНК. Метод записи электронной и цифровой информации в ДНК, которым пользуются современные ученые, трудоемок и может длиться больше десяти часов. Этот способ построен на многоуровневых процессах добавления ДНК-полимеразы к существующим последовательностям генетического кода.

В 2019 году учёные из Вашингтонского университета и Microsoft построили «первый в мире DNA-винчестер». Эта конструкция способна впервые обеспечить запись и считывание информации в ДНК-хранилище без участия человека, то есть процесс автоматизирован.

В 2021 году группа ученых Северо-Западного университета в США представила новый способ записи данных в ДНК, на который уходит всего несколько минут. Исследователи использовали ферментную систему, синтезирующую генетический код, которая записывает постоянно изменяющиеся сигналы из окружающей среды. Представленный исследователями способ отличается быстро реагирующим на перемены окружающей среды ДНК-ферментом, который преобразовывает запись информации в ДНК по принципу тикерной ленты. Благодаря возможности фиксировать изменения в ДНК при помощи биосенсоров технология оказалась практичной и пригодной к дальнейшему развитию для лабораторных испытаний. По словам ученых, в будущем они планируют использовать ее для исследования нейронов головного мозга.

Редактирование ДНК

Есть еще одна интересная, но пока не вполне изученная и безопасная возможность, связанная с ДНК — это ее редактирование. Редактирование генома является одним из видов генной инженерии, в котором может быть проведено включение, удаление или перемещение фрагментов ДНК в геноме организма, с использованием специфически спроектированных эндонуклеаз, или «молекулярных ножниц».

В ноябре 2017 года в Калифорнии прошла первая в мире процедура по «редактированию» генома взрослого человека прямо внутри его тела. Пациентом стал мужчина с синдромом Хантера.

В 2018 году родились Лулу и Нана — китайские генетически спроектированные девочки-близнецы, первые в мире дети, генетически отредактированные по клеткам зародышевой линии. Девочки родились здоровыми. Родители девочек были участниками клинического испытания, проведённого исследователем Хэ Цзянькуем, в котором он предлагал стандартные услуги по экстракорпоральному оплодотворению, но, кроме того, использовал CRISPR-Cas9, технологию, которая может модифицировать ДНК, для модификации гена CCR5 в зародышах. Это было сделано для придания генетической устойчивости против вируса ВИЧ (отец девочек был ВИЧ-инфицированным). Интересным фактом является то, что отключение гена CCR5 имеет положительный побочный эффект на развитие мозга: улучшается память, повышается способность мозга восстанавливаться после инсульта, а также возможно есть связь с более высокой успеваемостью в школе и общим интеллектом (это показывают наблюдения за людьми с природным дефицитом этого гена, а также эксперименты на мышах).

Эксперимент по генетическому редактированию проводился тайно до ноября 2018 года. В декабре 2019 года Хэ Цзянькуй получил 3 года лишения свободы и 3 млн юаней штрафа за нарушение законодательства в области экспериментов с людьми и проведение медицинских процедур без лицензии. При этом китайские власти официально признали рождение первых в мире генно-модифицированных людей.

В настоящее время эксперименты в области редактирования ДНК человека по зародышевой линии запрещены в большинстве стран. На это есть как минимум 2 причины: 1) этические соображения, и 2) на сегодняшний день технология признана научным сообществом недостаточно безопасной.

ДНК и будущее

Что нас может ожидать в будущем в сфере работ с ДНК?

Взгляд в недалекое прошлое. Каких-то 25 лет назад трудно было даже представить такую привычную сегодня вещь как смартфоны, планшеты. 40 лет назад абсолютному большинству людей на планете не пришло бы в голову что возможны мобильная связь, интернет. 60 лет назад персональные компьютеры были бы чудом. 100 лет назад не было телевизоров, полетов в космос, всевозможной высокотехнологичной промышленной и бытовой техники которая есть сейчас. 200 лет назад никто, включая ученых, не смог бы представить что возможны такие технологии как фотография, телефонная связь, радиосвязь, еще не были открыты электромагнитные волны.

Технологический прогресс постоянно ускоряется. Что будет возможно через 20, 30, 50 лет в области научных работ с ДНК, если уже сегодня записывают в ДНК информацию, создают ДНК-наноработов, редактируют геном и используют биокомпьютеры? Возможно ли будет воссоздание людей на основе найденных ДНК тех, кто умер? Возможно ли будет воскрешать людей, создавая в лабораториях синтетические ДНК, загружая в них нужную информацию, выращивая тела и мозг людей? Время покажет.

© Habrahabr.ru