Günümüzde, modern arşivleme teknolojisi, artan bilgi dağına yetişememeye başladı. Bu nedenle bu konuda yeni teknolojilere ihtiyaç vardır ve doğa bu konuda bize yardımcı olabilir.

2011 yılında European Bioinformatics Institute (EBI)’de çalışan bir ekip DNA üzerinde bilgi depolamaya yönelik bir fikir geliştirdi. Fakat, DNA depolaması mikrosaniye zaman ölçeğinde yazma ve okuma için silikon hafıza çiplerine göre oldukça yavaş olacaktı. Bilgiyi, sentez edilen DNA zinciri üzerine kodlamak ve bu bilgiyi okumak saatler alacaktı. Fakat hücre içerinde bütün bir genom çıplak gözle görünmez olacaktı. Depolanan bilginin yoğunluğu açısından ise, silikonun ötesinde olacaktı. Bu nedenle DNA, uzun süreli arşivleme için çok avantajlıdır.

DNA; adenin, guanin, sitozin ve timin olmak üzere dört tane nükleotit adı verilen yapı birimlerinden oluşur ve bu dört farklı nükleotitin kombinasyonu birbirinden farklı DNA dizilerini oluşturur. DNA sentezlemesi ve dizilemesinde her 100 nükleottite bir hata görülebilir. Bu da büyük ölçekte depolanmış olan veriyi güvenilmez hale getirir. DNA baz çiftlerine, bitler hatanın düzeltilmesi ve onarılması mümkün olacak şekilde kodlanabilir mi?

European Bioinformatics Institute’de çalışan bir ekip, DNA’ya beş dosya kodlayabildiklerini açıkladı. Bu dosyaların içerisinde Shakespeare’in şiirleri ve Martin Luther King’in konuşmasından bölümler de vardı. 2016 yılında bu kodlamanın boyutu 200 MB’a ulaştı.

Kalıcı arşivlerin depolanması için eski model manyetik kasetler pek tercih edilmez. Diğer yöntemlere göre daha büyük yoğunlukta veri depolayabilmelerine rağmen, okuması daha yavaştır. Ayrıca, 1 milyar gigabyte kasete depolandığında 1 milyar Amerikan dolarına mal olur ve oluşturulması 10 yıl sürer. Moleküler veri depolaması ise, bu gereklilikleri azaltır. Eğer veriler E.coli bakterisindeki genoma paketlenirse, dünyadaki depolama ihtiyacı 1 kilo DNA ile karşılanabilir. Bu potansiyele ulaşmak pek kolay olmayacaktır. Çünkü, DNA klasik depolama araçlarından farklı olarak canlı bir araçtır. Bunu başarabilmek için verinin sadece DNA’da kodlanması ve verinin alınması için, DNA zincirinin daha ucuz ve çabuk sentezlenmesi gerekiyor.

Uzun Süreli Hafıza

Dijital verideki birleri ve sıfırları DNA’nın dört bazı içerisine geçiren ilk kişi Joe Davis , 1988 yılında Harvard’taki araştırmacılarla birlikte çalışıyordu. E.coli bakterisine yerleştirdiği DNA dizisi sadece 35 bit kodluyordu.

Davis bugün bu konu üzerinde EBI’deki laboratuvarda çalışmaktadır. Buradaki araştırmacılar DNA sentezleme ve dizileme maliyetini düşürmeyi hedeflemektedirler. Aynı ekip, çok kısa DNA zincirlerinin 659KB depolamasını sağladılar. İkili koddaki sıfır adenin ya da sitozin olarak kodlanmıştır. Bir ise guanin ya da timin olarak kodlanmıştır. Bu da araştırmacıların özellikle guanin ve sitozin nükleotitlerinin yoğun olduğu bölgelerde okuma problemini kaldırarak diziyi tasarlamasını sağlıyordu. Bu iplikler dizilendiğinde 22 hata bulundu. Bu hatalar da güvenilir bir veri depolama için çok fazla sayılmaz.

EBI’deki araştırmacılar 739 KB veriyi depolamak için, görüntü ses dosyaları ve Watson ve Crick’in DNA’nın çift sarmal yapısını açıkladığı makalenin PDF versiyonu da dahil, çok sayıda DNA zinciri kullandı. Tekrarlayan bazlardan kaynaklanan hatalardan kaçınmak için, ikili kod yerine, 0, 1 ve 2’nin de dahil olduğu üçlü kod kullanılmıştır. Veri merkezlerinde bir hard diske üç yıldan fazla güvenilmemesine rağmen, veri DNA üzerine yazıldığında istenildiği herhangi bir zaman tekrar okunabilir. Burada etkili olan nokta, DNA’nın yoğunluğu ve stabilliğidir.

Standart dizileme yöntemleri kullanılarak, DNA’nın her bir zincirinin okunması mümkün değildir ama verilerin okunması için buna ihtiyaç duyulur. Araştırmacılar bu duruma bir çözüm getirebilmek için öncelikle çok küçük DNA parçalarına bilgi depoladılar. Daha sonra polimeraz zincir reaksiyonu (PCR) adı verilen bir yöntemle veri kodlayan DNA’nın çok sayıda kopyasını çıkarttılar. Kopya sayısının artması, dizilemeyi daha hızlı ucuz ve önceki yöntemlere göre daha güvenilir hale getirdi.

İllinois Üniversitesi’nden bir araştırma grubu, kodlanan dizileri yeniden yazmak için yeni bir yaklaşım geliştirdi. Bu yöntemde veriler, uzun DNA zincirleri üzerinde depolanır. PCR ya da CRISPR-Cas9 genom editleme yöntemleri de belli bir diziyi seçmek, çoğaltmak ve yeniden yazmak için kullanılır.

Dizinin okunması sırasında DNA zincirinin katlanması ve zincirdeki dizilerin üst üste gelmesi sorun yaratabilir. Bunu aşabilmek için ise ileri düzey matematiksel hesaplamalar gereklidir.
Şu an yapılan çalışmalarda 700 KB bilgi DNA üzerinde depolanabilmektedir. Fakat bu düzeyin 1000 katına ulaşılsa bile bu sadece bir CD boyutu oluşturuyor. Bu nedenle bu teknoloji, henüz dünya çapında veri arşivleme için yeterli düzeyde değildir. Ortaya çıkan bu kısıtlamanın nedeni, DNA sentezinin yeteri kadar hızlı olmamasıdır. DNA’ya her bir yeni nükleotidin eklenmesi 400 saniye alır. Bu hızdan dolayı fazla miktarda veri depolaması yapılabilmesi için milyarlarca DNA zincirinin eş zamanlı olarak sentezlenmesi gerekiyor. Şu anki maksimum eş zamanlı üretim ise 10,000 zincir ile sınırlıdır.

Yakın bir zamanda silikona dayalı depolama yöntemlerinin dışında alternatiflere ihtiyaç duyulacağı öngörülmektedir. Bu konuda yapılan çalışmalar incelendiğinde, DNA üzerinde veri depolama umut verici bir seçenektir. Fakat, bu teknolojinin gelişmesi ve kullanılması için 100,000 kat oranında depolama kapasitesinin artması gerekiyor.

Kaynakça:
https://www.nature.com/news/how-dna-could-store-all-the-world-s-data-1.20496

Yazar: Ayça Olcay

CEVAP VER

Please enter your comment!
Please enter your name here