科学家可以使用DNA将数据中心缩小到糖立方体中
Microsoft和华盛顿大学(UW)研究人员已经证明了使用合成DNA作为数据的档案存储形式的能力。
研究人员表示,如果该技术可以使其足够强大的主流使用,可以采取填充有当今最高容量数据存储设备的沃尔玛大小的超级中心,并将其缩小到糖立方体的大小。
“我们认为时间成熟是为了认真考虑基于DNA的存储,并探索系统设计和架构含义,”研究人员在纸质中写道。
该研究团队能够将来自四个图像文件的数字数据成功编码为合成DNA片段的核苷酸序列。更重要的是,它们也能够反转该过程 - 从更大的DNA池中检索正确的序列并重建图像而不丢失单个信息。
塔拉棕色摄影/华盛顿大学UW计算机科学与工程研究科学家将DNA样品混合储存。每个管都包含一个数字文件,这可能是猫或tchaikovsky交响乐的图片。
另一个实验表明了能够编码和检索从卢旺达法庭从卢旺达法庭“项目的UW”S“项目中验证档案视频文件的数据,该项目包含49个视频访谈,其中卢旺达战争犯罪法庭的法官,律师和其他人员。
“生活已经产生了这种奇妙的分子,称为DNA,有效地存储有关您基因的各种信息以及生活系统如何运作 - 它非常非常紧凑,非常耐用,”UW计算机科学和工程学教授研究论文的共同作者在一份声明中表示。
“我们”基本上重新批准它来存储数字数据 - 图片,视频,文件 - 以可管理的方式占数百或数千年,“他补充道。
DNA数据存储的研究迅速进行了。1999年,基于DNA的存储涉及编码和恢复23个字符的消息。
到2013年,来自U.K.的科学家们的Embl欧洲生物信息学研究所声称他们“D编码了一个.MP3的马丁路德国王”我有一个梦想“在DNA中的演讲。
研究人员在论文中发表的一篇文章中说,编码方法可以将至少1亿小时的高清视频中关于一杯DNA储存在一杯DNA中。
根据U.K.研究人员,储存在DNA链中的数据可以持续数千年。
阅读DNA是相当简单的,但写作这是一个主要的障碍。有两个挑战:首先,使用当前方法,只能在短条带中制造DNA。其次,写入和读取DNA都容易出现误差,特别是当重复相同的DNA字母时。
华盛顿大学合成三个图像文件并对DNA数据存储实验进行测序。
微软和UW研究人员表示,他们开发了“一种新的方法”,将数字数据的长串和零转换为DNA序列的四个基本构建块 - 腺嘌呤,鸟嘌呤,胞嘧啶和胸腺嘧啶 - 代表为GS,CS和ts。
要访问存储的数据,研究人员将相当于ZIP码和街道地址编码为DNA序列。聚合酶链式反应(PCR)技术 - 常用于分子生物学 - 帮助他们更容易识别他们正在寻找的邮政编码。
使用DNA测序技术,然后研究人员可以使用街道地址“读取”数据并将其转换回视频,图像或文档文件以重新排序数据。
“你是如何从那些人和零点到那样的,gs,cs和ts真的很重要,因为如果你使用聪明的方法,你可以使它非常密集,你不会得到很多错误,”Co-Author Georg Seelig说,乌斯电气工程副教授和计算机科学与工程。
微软和UW研究人员宣布突破ACM国际建筑支持的编程语言和操作系统的国际会议。
“DNA是一种有吸引力的可能性,”研究人员说,因为它非常密集,具有理论极限,这是比磁带更密集的八个数量级。磁带技术可以在单个墨盒上存储尽可能多的185TB,可以适合手掌。
微软和UW研究人员还确认了合成DNA的寿命,称它在恶劣环境中拥有500多年的半衰期。研究人员指出,胶带墨盒的寿命为10到30年,硬盘驱动器被额定到3到五年。
根据数字宇宙研究的数据,美国研究人员强调需要更密集的存档媒体,因为我们的计算机,历史档案,电影,照片和企业系统和移动设备将在2020年之前达到44万亿千兆字节来自IDC和EMC的纸张。
“与2013年相比,”这是一个10倍的增加,并且将代表足够的数据来填充六堆叠延伸到月球的计算机片。虽然并非所有这些信息都需要挽救,但世界正在生产数据比存储它的能力更快,“研究人员在纸质中说。
DNA存储系统仍然存在必须在其准备商业使用之前克服的问题。首先,DNA合成和测序远非完美,误差率为每核苷酸的1%。DNA存储的关键方面是通过添加冗余来设计能够容忍误差的适当编码方案。
此外,随机访问基于DNA的存储中的数据是有问题的,导致总读取延迟比写入延迟要长得多。目前的努力仅提供了大块访问;要从存储中读取单个字节,必须对整个DNA池进行排序和解码。
华盛顿大学科学家们提出了通过使用聚合酶链反应(PCR)来改善随机进入的方法,以仅扩增所需的数据,朝向其偏置测序。两者加速读取并确保不需要测序整个DNA池。
“这是我们”重新借用自然的东西 - DNA - 储存信息,“Ceze表示。“但是我们使用计算机中知道的东西 - 如何纠正内存错误 - 并将其申请回自然。”