這種新方法可能比其他的基因存儲方法更快、更簡單,。 如果地球上每個人都不得不依賴閃存(一種用于存儲卡和U盤的數(shù)據(jù)存儲系統(tǒng)),,那么到2040年,全球預計將產(chǎn)生的信息量將比微芯片級硅的預期供應量高出100倍,。為了防止這樣的危機,,研究人員一直在探索生命本身所依賴的一種存儲材料:DNA。 從理論上講,,這種物質可以儲存大量的信息——每立方毫米DNA可以儲存1eb(10億千兆字節(jié))的信息——長達數(shù)千年,。作為大多數(shù)數(shù)字檔案基礎的磁帶的最長壽命約為30年,但70萬年前化石的DNA仍然可以測序,。然而,,使DNA數(shù)據(jù)存儲成為現(xiàn)實的一個障礙是,創(chuàng)建或合成符合所需代碼的新DNA序列的過程緩慢,、昂貴且容易出錯,。 伊利諾伊大學厄巴納-香檳分校(University of Illinois at Urbana-Champaign)的編碼理論家奧吉卡·米倫科維奇(Olgica Milenkovic)表示:“在記錄成本、準確性和書寫速度方面,,合成DNA是一個主要瓶頸,。”她和她的同事提出了一種新的解決方案:用“刻痕”模式標記現(xiàn)有的DNA分子來編碼數(shù)據(jù),,而不是從頭開始自定義合成DNA,。這種方法受到打孔卡的啟發(fā),打孔卡是一種硬紙板,,在特定的位置打孔,,用來存儲許多早期計算機的信息,包括二戰(zhàn)時期的ENIAC,。研究人員周三在《自然通訊》(Nature Communications)雜志上詳細介紹了他們的技術,。 以前的DNA存儲方法處理四種關鍵的DNA成分,即堿基——腺嘌呤,、胸腺嘧啶,、胞嘧啶和鳥嘌呤類電子比特,即編碼數(shù)字數(shù)據(jù)的1和0,。例如,,每個堿基可能被賦值為00、01,、10或11,。但是,,這種新方法并沒有將一系列的位元轉換成DNA代碼,也沒有合成相應的堿基串,,而是把現(xiàn)有的遺傳物質當作類似于早期打孔卡片的紙張,。這項研究的主要作者S. Kasra Tabatabaei說,酶是“打孔的設備”,。在這種情況下,,這些“孔洞”是組成DNA骨架的分子之間被切斷的鍵。出現(xiàn)這個標記表示1,,若沒有則表示0。 布朗大學(Brown University)的理論化學家布倫達·魯賓斯坦(Brenda Rubenstein)說,,這項研究最有趣的方面是它如何依賴于自然,。她沒有參與這項研究。她說,,“研究人員讓這些酶做它們最自然的事情,,從而留下痕跡來儲存信息” 為了精確定位這些“孔洞”(即酶留下的痕跡),研究小組對雙鏈DNA分子進行加熱直到它們在中間展開一點點,。這個過程會形成氣泡,,使堿基暴露在外。接下來,,科學家用單鏈DNA分子,,每個分子只有16個堿基長,讓它們附著在這些氣泡內相應的堿基序列上,。這些單鏈分子的末端起著向導的作用,,告訴酶去哪里。在DNA中,,每個堿基連接一個糖分子和一個磷酸基,,形成一種稱為核苷酸的化合物。新技術中使用的酶切斷了一個核苷酸與另一個核苷酸之間的連接,,從而在糖-磷酸軌道上形成一個缺口,。 因為這種方法不需要合成精確的DNA序列,研究人員說,,它的一個重要優(yōu)勢是,,他們可以像打孔卡一樣處理幾乎任何DNA分子。例如,,他們用從現(xiàn)成的大腸桿菌菌株中廉價獲取的遺傳物質進行實驗,,研究人員知道這些菌株的非常精確的序列。利用450個堿基對的細菌DNA鏈,,每個堿基對包含5到10個孔洞,,科學家編碼了亞伯拉罕·林肯的葛底斯堡演說的272個單詞和一個14千字節(jié)的林肯紀念堂的圖像,。在他們把這些信息放在DNA上之后,使用測序技術以很高的準確率讀取出了這些文件,。 魯賓斯坦說:“多年來,,人們一直認為分子計算就是把我們在硅上所做的事情映射到分子上,從而產(chǎn)生了很多小題大做的裝置,。相反,,這項新研究表明,酶在數(shù)百萬年的進化過程中,,其效率是令人難以置信的,。” 科學家們希望他們的方法能比那些依靠合成DNA的方法更便宜,、更快,。然而,過去提出的DNA數(shù)據(jù)保存策略仍然有一些優(yōu)勢,,比如存儲密度大約是穿孔卡技術的12到50倍,。不過,目前DNA數(shù)據(jù)存儲的最大問題不是密度,,而是成本,。米倫科維奇說,“我們的成本真的很低,,甚至可以更低,。此外,她補充說,,較老的DNA存儲系統(tǒng)必須包含冗余序列,,這是防止傳統(tǒng)DNA合成易出錯的一種保障。這一需求減少了它們實際能夠容納的數(shù)據(jù)量,,縮小了它們與新技術之間的存儲密度差距,。 |
|