В Гарварде записали анимацию в ДНК живого организма

f626d56085d020c9558f4e40ba9ed758.jpg
Термин «вирусное видео» приобретает новый смысл в связи с экспериментом, который провели учёные Гарвардской медицинской школы. Им удалось записать цифровую информацию не просто в синтезированный генетический материал, а в гены живой бактерии E.coli. Это значит, что живой организм может выступать носителем цифровой информации и хранить файлы непосредственно в ДНК.

Учёные давно экспериментируют с хранением цифровых файлов в ДНК, поскольку этот носитель отлично подходит для цифровой информации. В конце концов, это всего лишь код в четверичной системе счисления: генетическая программа кодируется четырьмя нуклеотидами, которые обозначаются символами A, G, C и T, и она вмещает очень много информации в ограниченном пространстве.
Эксперименты с записью файлов в ДНК были особенно успешными в последние пять лет. В 2012 году гарвардская группа записала в синтезированную макромолекулу ДНК текст книги на 53 000 слов. Абсолютный рекорд был поставлен в марте 2017 года, когда в ДНК записали 200 мегабайт информации. Даже Microsoft подключилась к этим научным опытам: год назад стало известно, что Microsoft заказала у компании Twist Bioscience синтез 10 млн макромолекул ДНК с определённой последовательностью нуклеотидов. Интересно, что производитель изготовил молекулы, не мог прочитать записанную туда информацию, потому что не имел ключа расшифровки.

До настоящего времени все эксперименты происходили преимущественно с синтезированными ДНК, ещё никогда учёным не удавалось записать цифровую информацию в живой организм, а затем успешно прочитать её. Это гораздо более сложный процесс, но исследователи из Гарварда сделали это с помощью техники редактирования генома CRISPR.

CRISPR (clustered, regularly interspaced, short palindromic repeats) базируется на механизме антивирусной защиты в организме. Иммунная система распознаёт чужеродные вирусы, захватывает у них фрагмент ДНК и помещает его в базу сигнатур, которая хранится геноме бактерии. Учёные обманули систему, подсовывая фрагменты своего анимированного файла, кадр за кадром, вместо вирусов. Обманутая иммунная система сама сложила из них нужную последовательность.

Для записи выбрали одно из первых в истории анимированных изображений в истории фотографии — чёрную лошадь, движущуюся на белом фоне, которую записал на своей ферме в Пало Альто (Калифорния) английский и американский фотограф Эдвард Мейбридж в 1877 году. Это был первый в мире успешный опыт хронофотографии. Спустя двадцать лет опыт перенимут братья Люмьер и назовут его кинематографом.

2ca2aa4a1d53d4612011389e207d9973.jpg
«Лошадь в движении» Мейбриджа

В ДНК был записан анимированный файл с бегущей лошадью размером 36×26 пикселей. Затем с помощью техники секвенирования ДНК исследователи восстановили анимацию с точностью 90%.

7cba917d0668916293c9169f899b69e0.gif
a7bf85eede8a4e298d87b8fda2e073e4.png

Плотность записи информации в ДНК гораздо выше, чем во флеш-памяти или на магнитных носителях. В 1 грамм ДНК можно записать около 1 зеттабайта файлов (10²¹ байт), а вся генетическая программа человека помещается в 1,6 ГБ. По другим оценкам, если посчитать общий объём информации в ДНК всех человеческих клеток, то выходит около 60 ЗБ, а 99,9% этой информации у всех одинаково.

Авторы научной работы говорят что ДНК имеет ценность не только как носитель существующей информации, но и как средство для записи биологических процессов в организме, которые потом можно будет считать и расшифровать, как лог-файлы с сервера. Например, науке неизвестно, как происходит развитие клеток на ранней стадии. Ведь всё разнообразие человеческих клеток развивается из совершенно одинаковых плюрипотентных стволовых клеток. По неведомым причинам некоторые из этих клеток превращаются в клетки мозга, другие — во внутренние органы, в кровяные клетки и т. д. Процесс выбора роли и времени, когда принимается «решение» о превращении в ту или иную клетку, а также о факторах, под воздействием которых принимается это решение, пока до конца не исследованы наукой. Возможно, «цифровые» логи — система записи и хранения информации внутри клеток — дадут хронологическую запись развития клетки и помогут нам разобраться в деталях этого процесса. Но сначала систему проверяют на цифровых данных.

Любопытно, что задолго до развития молекулярной биологии о записи информации в ДНК говорил Ричард Фейнман: «Биология не просто пишет информацию, она нечто делает с ней», — говорил он в лекции 1959 года. Та его лекция подтолкнула д-ра Леонарда Адельмана (один из соавторов алгоритма шифрования RSA, где его фамилию обозначает буква А) к первым экспериментам по записи данных в ДНК. В 1994 году он сообщил, что молекулярные вычисления сумели решить математическую задачу из комбинаторики.

Прогресс в биоинформатике идёт сумасшедшими темпами. Первое секвенирование человеческого генома заняло несколько лет и стоило $3 000 000 000. Самые оптимисты говорили, что спустя 50–60 лет мы сможем снизить стоимость до $1000. На самом деле для этого понадобилось шесть лет.

Научная работа опубликована 12 июля 2017 года в журнале Nature (doi:10.1038/nature23017, pdf).

© Geektimes