DNA 存储数据可能不实用,但它是可行的——而且听起来确实很酷

研究人员将一个操作系统和一部短片存储在DNA上。
cd
DNA会成为下一个信息存储介质吗?Pixabay

我们的DNA是我们一切特征的编程代码。现在,它被用来编码视频和操作系统。DNA具有密度高和耐用性强的特点,一克DNA可以存储200 PB(200,000,000,000,000,000字节,或约等于200,000台笔记本电脑)的数据,正如本周《科学》杂志上的一项研究所示。专家表示,在信息爆炸时代,DNA可能是一种有前景的存储解决方案——如果成本不是问题的话。

哈佛大学的研究人员在2012年存储了一本50,000字的英文书。大约在同一时间,欧洲生物信息学研究所存储了包括莎士比亚十四行诗和“我有一个梦想”演讲的音频片段。但最新研究的特别之处在于,它使用了一种编码技术,这种技术不仅使存储效率提高了60%,而且对错误的鲁棒性更强,共同作者、哥伦比亚大学计算机科学教授、纽约基因组中心核心成员Yaniv Erlich说道。

Erlich说,一旦你弄清楚了如何进行编码,或者需要合成或写入数据的DNA,剩下的就很简单了:一家公司可以负责制造实际的DNA。“数据只不过是0和1的流。DNA基本上就是由四种核苷酸组成的序列。你需要将这些核苷酸映射到这些比特对中,”Erlich说。

但DNA合成可能是一件棘手的事情。Sri Kosuri,2012年哈佛大学论文的首席作者,现任加州大学洛杉矶分校生物化学教授(他并未参与最新研究),表示“最大的问题是,大约有5%或更少的时间,一小段随机DNA就会丢失。”

Kosuri说:“合成它很难,而且不知道为什么读出来也难。所以,如果你能使用一种对(这种)丢失具有鲁棒性的编码,DNA存储(就会)变得容易得多,也干净得多。”

Kosuri说,Erlich的论文正是展示了这一点——该方法能够容忍DNA合成过程中的不完美之处。研究人员通过应用一种特殊的编码技术实现了这一目标,这种技术通常用于转换在连接中断等信道上传输的数字信息,例如手机上流式传输的YouTube视频。Erlich表示,他们的结果表明,这种编码技术能够处理比他们在研究中使用的质量低得多的DNA。“我们仍然可以获得我们需要的结果,并正确地检索信息。”

该团队成功地在DNA中存储并恢复了一个操作系统,这“是一件很优雅的事情,”苏黎世联邦理工学院化学工程师Robert Grass说,他并未参与这项研究。“作为日常用户,我知道它必须是无错误的,”Grass说。

Erlich说,他们特意放入了一个操作系统:“我们想表明,我们不怕放入那些如果我们不能完美地恢复文件就可能完全搞砸的东西。”

Kosuri同意该论文的方法是有效的。“我认为他们进行了正确的实验来测试该算法。他们选择了正确的算法,并且看起来它奏效了。”

但就像五年前首次将数据存储在DNA中一样,Kosuri说,它仍然贵得离谱。“这种成本可能比任何有竞争力的方式都要高出一百万倍,”Kosuri说。

在这项研究中,研究人员花费了近10,000美元来编码仅2MB的数据。这相当于一张旧的3.5英寸软盘的存储量,但成本却相当于大约10台Macbook Air。

尽管这种新方法可以通过允许我们使用“非常糟糕的DNA”来降低一些合成成本,Kosuri说,但成本仍然会高得离谱,不切实际。

关于成本,Grass表示DNA合成的成本比测序的成本更是一个障碍。“测序的成本对于应用来说仍然太高,但随着像纳米孔这样可以插入计算机并测序DNA的技术的出现,成本在不断下降,”Grass说。“合成的成本还更靠后。”

Grass说,如果我们想将信息存储在DNA中数百年,还需要采取额外的措施来稳定DNA。他解释说,与锁在骨骼和化石中的遗传物质不同,游离DNA是不稳定的。如果你只是把它放在实验室里,它只能保存一年,之后信息就会开始丢失。

尽管成本高昂,但DNA的密度和可行性仍然使其比其他具有类似功能的较新技术更具吸引力。“这里的存储密度与在表面定位单个原子的技术相当,”Kosuri说,他指的是1989年IBM用35个氙原子拼出“IBM”的论文

Kosuri说:“你可以做到那样的事情,但它是在接近绝对零度、在真空和(使用)[强大的]成像技术下完成的。那是竞争技术。(DNA存储)比那更实用,但比我们[通常]想到的东西(如软盘或U盘)要不实用得多。”

DNA还允许你进行3D存储。全息存储磁轨内存是实现这一目标的另外两种方法。但根据Kosuri的说法,DNA的密度仍然“高出许多倍”。

因此,Kosuri表示,继《科学》杂志这篇论文之后,阻碍DNA存储大规模应用的唯一因素就是其成本。“关于编码,存在着所有其他问题,比如它们是否能奏效,是否可靠,所有这些问题似乎都被这篇论文解决了。在我脑海中唯一剩下的问题就是成本问题。”

Kosuri本人不再研究DNA存储,但他对该技术未来的发展仍然持乐观态度。“一百万倍听起来很多,但在过去的15年里,我们已经实现了大约一百万倍的成本[下降]。不仅是测序,合成部分也下降了不少,”Kosuri说。

Erlich设想,未来可以创建一个“专门用于DNA存储的流程,我们可以进行快速而粗糙的DNA合成”,以进一步降低成本。

Erlich说:“我们可以食用这些半生不熟的蛋糕,并根据我们的编码策略正确地获取数据。这就是我们希望未来能够进行实验的。”

目前的这项研究是一个良好的开端。研究人员存储和恢复的内容都对错误很敏感:一个操作系统、一个计算机病毒、一张50美元的亚马逊礼品卡、一部1895年的法国电影(《火车进站》)、一块先驱者号探测器铭牌,以及信息理论家克劳德·香农在1948年发表的一项研究。

Erlich说:“人们会问,‘你怎么能把视频放进DNA里?’我不得不向我六岁的儿子解释。”

“它吸引了人们的想象力。这就是我们想做的,对吧?我们想让公众参与到科学的乐趣中来。”

 

更多优惠、评测和购买指南

 
© .