近日,天津大學應用數學中心吳華明教授團隊研發了一種全新的DNA存儲系統——HELIX,並成功實現了60MB的醫學影像(時空組學)圖片信息的存儲與恢復。這是我國科研人員在DNA存儲領域取得的又一次新突破。此前,北京大學張成和錢瓏DNA存儲團隊首次提出了一種基於並行寫入策略的DNA存儲方法,利用分子活字印刷的方式,將大熊貓彩色照片存入表觀分子修飾中,實現了27.5萬比特的非傳統DNA存儲。
什麼是DNA存儲?DNA存儲有哪些優勢?業內專家告訴記者,DNA存儲是一種利用人工合成的脫氧核糖核酸(DNA)作為信息載體的新型存儲技術,具有密度大、耗能低、無磨損和壽命長等潛在優勢。
“理論上,僅1克DNA就能存儲約1000萬小時的高清視頻數據,也許1公斤DNA便能裝下全世界的數據。”北京大學計算機學院副研究員張成説,“DNA分子的雙螺旋結構和自組裝特性,使其在甚小空間內也可以緊湊排列,承載極高密度的信息。”此外,DNA的四種鹼基(腺嘌呤A、胞嘧啶C、鳥嘌呤G和胸腺嘧啶T)的排列組合變化無窮,也就意味着它們可以編碼幾乎無限量的信息,使得DNA理論上具備比任何現有存儲設備更高的存儲容量。
DNA可以保存多久?最新答案是200萬年。近年科學家曾從格陵蘭島凍土中成功提取200萬年前的DNA序列,其中信息仍歷歷可辨。DNA存儲不僅存得久,而且存得牢,若能有效避免水分與紫外線的影響,DNA可以在數十萬年內保持穩定不變。更重要的是,DNA存儲額外耗能極低,理想保存環境與日常環境相差不大。要想在能源有限條件下實現數據的長期保存,DNA存儲堪稱首選。
如何把數據存入DNA?張成介紹,傳統的DNA存儲方法首先是將數據進行編碼,也就是將二進制數據按照設定好的編碼規則轉化為DNA序列;接下來,通過合成DNA分子實現存儲的信息寫入,即按照編碼的順序逐個加入鹼基,以串行的方式合成DNA鏈;第三步就是存儲與讀取。
為什麼需要研發DNA存儲技術?國家數據局發布的《全國數據資源調查報告(2024年)》顯示,2024年全國數據生産總量達41.06澤字節(ZB),同比增長25%。面對數據量的爆炸式增長,傳統存儲方式面臨容量有限、維護成本高、設備壽命短等諸多挑戰,尋找新一代存儲介質迫在眉睫。2022年,我國“十四五”規劃將DNA存儲列為與新一代移動通信技術、量子信息、第三代半導體等並列的新興技術。當前,作為未來産業的前沿方向之一,DNA存儲已形成以核心城市為引領、産學研聯動的多區域發展格局,北京、上海、天津、深圳等多地均有所布局。以北京市為例,今年北京將在未來信息、未來健康等六大領域持續發力,推動未來産業發展全面提速,其中包括DNA存儲等前沿方向。
何時能用上DNA存儲?業內專家告訴記者,DNA存儲的産業化落地道阻且長。“當前,DNA存儲還面臨存得貴、讀得慢等痛點。”張成&&,一是成本高昂,目前合成2MB的DNA數據需要約7000美元,讀取數據需要約2000美元,如果以DNA形式存儲1GB大小的電影,大約需要花費358萬美元;二是讀寫速度太慢,以目前的技術,在合成DNA時每添加一個鹼基都需要多個操作環節,尚無法滿足日常簡單的實時數據存儲需求;三是讀取環節準確率不高,例如寫入過程可能出現不正確的修飾等錯誤,讀取時也可能因測序誤差導致還原數據不準確等狀況。
正因如此,科研人員正在加快底層核心技術突破,研發新型DNA存儲技術,以期推動DNA存儲産業化。例如,2024年北大DNA存儲團隊提出的並行寫入策略DNA存儲方法,並不依賴於傳統的“從頭合成”寫入路線原理,而是利用甲基修飾比特編碼信息,將信息並行地打印在DNA分子之上。相關技術不僅為實現快速、低成本的大規模分子數據存儲奠定了基礎,還為未來DNA存儲的發展提供了全新思路。
“DNA存儲要實現商業化應用,還需在底層技術層面進一步取得突破,從而在降低成本、提高速度、提升準確率等多個方面取得跨越進展。”張成&&。(記者 吳蔚 張漫子)