Човечеството има огромен проблем със съхранението на данни. През последните две години хората са създали повече информация, отколкото през цялата предишна история. И този поток от информация скоро ще надмине капацитета на твърдите дискове.
Изследователите казват, че са намерили нов начин за кодиране на цифрова информация в ДНК. Един грам ДНК може да съхранява 215 петабайта (215 милиона гигабайта) данни. Така цялата информация, създавана някога от човека, ще заема контейнер с размерите на няколко камиона.
ДНК има много предимства за съхраняване на цифрова информация. Той е изключително компактен и може да се съхранява хиляди години на хладно и сухо място. И хората винаги ще могат да го разгадаят. „ДНК не се разгражда с времето като касети или дискове и няма да остарее“, казва Янив Ерлих, учен от Колумбийския университет (САЩ).
Учените съхраняват цифрова информация в ДНК от 2012 г., когато генетиците от Харвардския университет (САЩ) Джордж Чърч, Шри Косури и техните колеги кодираха книга от 52 хиляди думи в хиляди фрагменти от ДНК, използвайки нишки от четирибуквената азбука - A, G, T и C за кодиране на нулите и единиците на дигитализирания файл.
Тази система за криптиране е относително неефективна и може да съхранява само 1,28 петабайта на грам ДНК. Други подходи са работили по-добре. Но никой не позволи на ДНК да запази повече от половината от максималния си капацитет. ДНК може да издържи около 1,8 бита на ДНК нуклеотид (броят не достига 2 бита поради редки, но неизбежни грешки при четене и запис).
Ерлих реши, че ще се доближи до тази граница. Затова той и Дина Жилински се обърнаха към алгоритмите, които се използваха за криптиране и декриптиране на информация. Те започват с 6 файла, които включват пълна компютърна операционна система, компютърен вирус, френски филм от 1895 г., озаглавен „Пристигане на влак в Ла Сиота“, и проучване от 1948 г. на теоретика Клод Шанън. Първо учените преобразуваха файловете в двоични низове от единици и нули, компресираха ги в един основен файл и след това разделяха данните на кратки низове от двоичен код. Те разработиха алгоритъм, наречен "Фонтанът на ДНК", който хаотично пакетира вериги в така наречените "петна". Изследователите добавиха допълнителни етикети към тях, за да могат да бъдат възстановени по-късно в правилния ред. Общо учените са създали дигитален списък от 72 хиляди ДНК вериги,всеки 200 знака по дължина.
Промоционално видео:
Те ги изпратиха като текстови файлове до стартиращата компания Twist Bioscience в Калифорния, където синтезираха ДНК вериги. Две седмици по-късно Ерлих и Жилински получиха по пощата ампула с парче ДНК, в която техните файлове бяха криптирани. За да ги дешифрират, учените са използвали съвременна технология за секвениране на ДНК. Последователностите бяха изпратени на компютър, който преведе генетичния код обратно в двоичен файл и използва етикетите за повторно сглобяване на шестте оригинални файла. Технологията работи толкова добре, че новите файлове не съдържат грешки.
Косури и Ерлих обаче отбелязаха, че новият подход не е готов за широкомащабна употреба. Те похарчиха 7 хиляди долара, за да синтезират 2 мегабайта информация във файлове, и още 2 хиляди долара, за да я прочетат. В сравнение с други форми на съхранение на данни, писането и четенето от ДНК е относително бавно.