ДНК като флаш устройство: защо да запишем цифрови данни в генома - Алтернативен изглед

Съдържание:

ДНК като флаш устройство: защо да запишем цифрови данни в генома - Алтернативен изглед
ДНК като флаш устройство: защо да запишем цифрови данни в генома - Алтернативен изглед

Видео: ДНК като флаш устройство: защо да запишем цифрови данни в генома - Алтернативен изглед

Видео: ДНК като флаш устройство: защо да запишем цифрови данни в генома - Алтернативен изглед
Видео: Настя и сборник весёлых историй 2024, Може
Anonim

Нарастването на обема на цифровата информация подтиква учените да търсят по-компактни начини за запис и съхраняване. И какво може да бъде по-компактно от ДНК? РИА Новости, заедно с експерт, измислиха как да кодират думи с нуклеотиди и колко данни съдържа една молекула.

Причини-кодове

ДНК е последователност от нуклеотиди. Има само четири от тях: аденин, гуанин, тимин, цитозин. За кодиране на информация, на всеки от тях е присвоен цифрен код. Например, тимин - 0, гуанин - 1, аденин - 2, цитозин - 3. Кодирането започва с факта, че всички букви, цифри и изображения се преобразуват в двоичен код, тоест последователност от нули и такива и те вече се преобразуват в последователност от нуклеотиди, тоест четвъртичен код.

Преди да кодирате данните в ДНК, трябва да ги преведете в цифров код / Илюстрация от РИА Новости. Алина Полянина
Преди да кодирате данните в ДНК, трябва да ги преведете в цифров код / Илюстрация от РИА Новости. Алина Полянина

Преди да кодирате данните в ДНК, трябва да ги преведете в цифров код / Илюстрация от РИА Новости. Алина Полянина.

Само три нуклеотида могат да бъдат използвани за изграждане на код (тризъбен код), а четвъртият е за разчупване на последователности на части. Има вариант с изграждането на бази под формата на двоичен код, когато две от тях съответстват на нула, а две съответстват на една.

За четене се използват няколко техники. Едно от най-често срещаните е, че верига от молекула на ДНК се копира с помощта на основи, всяка от които има цветен знак. Тогава много чувствителен детектор чете данните и компютърът използва цветовете, за да възстанови нуклеотидната последователност.

„ДНК молекулата е много обемна. Дори в бактериите обикновено съдържа около милион основи, а при хората - три милиарда. Тоест всяка човешка клетка носи обем информация, съпоставим с капацитета на флаш устройство. И имаме трилиони такива клетки. Голямо количество данни могат да бъдат записани в ДНК, но писането и четенето от такъв носител все още е твърде бавно и скъпо”, казва Александър Панчин, доктор, старши научен сътрудник в Института за проблеми с предаването на информация на А. А. Харкевич, Руска академия на науките.

Промоционално видео:

Плътността на записа нараства

През юни 1999 г. сп. Nature публикува статия на американски учени, които разработиха техника за изпращане на секретни съобщения с помощта на ДНК. Те синтезираха молекула чрез включване на нуклеотидна последователност, образувана с помощта на четвъртичен код. Тайната ДНК в сместа беше изпратена в друга лаборатория. Служителите му, използвайки специални химически ключове, намерили желаната молекула и извлекли информация от нея.

„Като цяло има два подхода за записване на данни за ДНК. Първото е, когато синтезирате напълно нова ДНК, използвайки химически синтезатор. По команда на компютъра нуклеотидите се добавят към разтвора в определен ред и необходимата базова верига постепенно "расте". Във втория случай данните са кодирани във вече съществуващата ДНК на организма “, обяснява Панчин.

През май 2010 г. групата на Крейг Вентър, който за първи път картографира човешкия геном, публикува документ за създаването на изкуствена бактерия. Те взеха за основа бактериална клетка, пречистена от генома, и поставиха там образуваната основна последователност. Резултатът е нова бактерия, доста активна и жива, която се различава от обичайната само по това, че нейната ДНК е създадена на ръка. Освен това екипът демонстрира усещане за красота, като напише техните имена и цитати от класици, използвайки четвъртичен код в ДНК на бактерията.

През 2012 г. група, водена от молекулярния биолог Джордж Чърч, предприе по-фундаментален подход и кодира ДНК 52 000 думи книга Regenesis: How Synthetic Biology Reinvent Nature and Weself, няколко снимки и една програма на Java. Те използвали двоичен код. Общото количество данни е било 658 килобайта. Установено е, че плътността на информацията е почти 1018 байта на грам молекули. За сравнение, 1012-байт твърд диск тежи около сто грама. Основният недостатък на този метод е нестабилността на записаната информация.

„ДНК молекулата има тенденция да мутира, което намалява надеждността на съхранението на данни. Особено, ако носителят на ДНК е жива клетка, способна да се дели: когато ДНК се дублира, грешките пълзят особено често. Надеждността на съхранението на данни ще се увеличи, ако имате хиляди копия на едно и също съобщение. Или просто съхранявайте ДНК, да речем, във фризера. При ниски температури способността на молекулата да мутира значително се намалява “, обяснява експертът.

Освен това понякога информацията се губи при четене. Грешките могат да бъдат от химичен характер, когато към даден елемент е прикрепена неправилна основа, или чисто изчислени, тоест в зависимост от компютъра.

Скъп, надежден

През март 2017 г. сп. Science публикува статия на американски учени, които успяват да напишат 2 * 1017 байта на грам ДНК. Биолозите подчертават, че не са загубили нито един байт. Просто казано, това, което записахме, е това, което получихме на изхода.

За обикновен потребител "генетично флаш устройство" все още не е на разположение, тъй като е много скъпо да се съхранява информация върху него, а скоростта на четене / запис е ниска. Учените смятат, че четенето само на един мегабайт изисква около три и половина хиляди долара и няколко часа време.

Несъмнените предимства на запис на информация върху ДНК включват огромната плътност на данните, както и стабилността на носителя - обаче само при ниски температури.

Препоръчано: