天大主页 | 设为首页 | 添加收藏
首页 > 媒体报道 > 正文

央视新闻:天津大学团队创新DNA存储算法 让敦煌壁画再“活”千年

      2022-10-12       

近日,天津大学元英进院士带领的合成生物学科研团队创新DNA存储算法,将十幅敦煌壁画存入DNA中,通过实验验证壁画信息在实验室常温下可保存千年。这一算法支持DNA分子成为世界上最可靠的数据存储介质之一,可以让面临老化破损危机的人类文化遗产信息保存千年万年。

DNA存储的敦煌壁画

有着千年历史的敦煌壁画精美浩瀚,也被称为墙上的博物馆。但是,历经时间沧桑,饱经风吹雨淋的壁画也面临着风化、腐蚀的风险。下一个千年,如何让我们的子孙后代感受到这绚烂的文明?在距离敦煌千里之外的天津大学,韩明哲所在的合成生物学科研团队,正在努力把承载厚重文化的敦煌壁画,存储到小小的DNA当中。

把壁画植入DNA,看似天方夜谭,其实有着成熟的理论基础。DNA由四个碱基组成,即腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶,碱基不同的排列顺序,决定了生命体不同的特征表达,我们的肤色、身高、头发的颜色等,都是由不同的DNA决定的。这与计算机的二进制算法在原理上非常类似,互联网上万花筒般的丰富讯息,本质上都是数字0和1的排列组合。把壁画写入DNA,也正是利用了这一原理。

DNA存储技术概念图

天津大学科研团队成员韩明哲表示,壁画其实是有颜色信息的,被数字化以后是以数字图像的方式保存在计算机中的,本质上也就是二进制的比特数据。DNA存储相当于把二进制的信息转码为四进制的信息,敦煌壁画的信息就保存在DNA当中了。

相较于磁、光、电等常规的信息存储介质,DNA存储有3个最显著的优势,即存储密度高、存储时间长、所需能耗低。韩明哲用一个形象的比喻来形容:如果把全世界所有的数据用DNA存储,只需要一个马克杯就能装下。而科学家们不断在冰层冻土中发现的数万年前猛犸象、古细菌的DNA,则是DNA存储时间长的一个佐证。相较于传统介质以十年计的寿命,这确实是让科学家着迷的突破。韩明哲介绍,我们现在所用到的硬盘光盘,保存的时间其实不长,普遍是10年左右,而且能耗极高。

但是,长时间保存在常温或更加恶劣的环境条件下,DNA会面临断裂降解等风险,就像硬盘中的数据损坏,影响信息存储的长期可靠性,这也是DNA存储领域亟待解决的科学难点。对此,天津大学团队设计了一种序列重建算法,突破了这一难题,这也是团队研究的创新之处。

基于德布莱英图图论设计的序列重建算法高效解决DNA断裂、降解问题

天津大学科研团队成员韩明哲介绍说,团队把已经碎片化的一些DNA信息重新正确地连接在一块。相当于通过拼图的方式把这些片段重新拼合在一起。这样就保证了DNA保存信息的长期稳定性,哪怕它断了之后,团队也依然有办法进行数据恢复。

根据韩明哲所在团队的实验数据推算,他们设计的算法可以让存储着数据的DNA在25°C条件下自然保存一千年或者9.4°C条件下自然保存两万年。时间长度的延展,就像我们的中华文明,几千年来生生不息,这也是团队把DNA存储技术应用于文博领域的初衷。韩明哲和团队成员们都相信,在千年以后,当他们制作的,承载着敦煌壁画的DNA被解码,一个古老的历史世界也就此在后人面前开启。

目前,由于存储成本和信息读写等原因,DNA存储的研究还尚在实验室阶段。但是人类信息的爆发式增长,以及对数据存储的迫切需要,给了DNA存储技术广阔的应用空间。有专家预测,到2025年,人类数据预计达到175 ZB,而一个1个ZB代表的是十万亿亿字节,其中80%-90%是很少被调用的冷数据。在未来,DNA极有可能成为冷数据的主要存储介质。

天津大学科研团队成员韩明哲说:“在这么一个庞大的信息量下,有90%的信息都属于冷数据。一些信息可能几年都没有去看过,但是也必须要进行保存,比如说银行的流水,可能10年前的流水数据,依然必须把每一笔的交易记录下来。所以在DNA存储不断向前发展的过程当中,我相信会在冷数据的存储和归档方面,首先来绽放它的作用和能力。”

央视新闻:天津大学团队创新DNA存储算法 让敦煌壁画再“活”千年 (cctv.com)

(编辑 刘晓艳 张佳丽)