本周,IBM 推出了 Diamondback 磁带库,重申其立场:磁带是一种持久的数据存储形式。没错,就是那种像上世纪录像带和卡带里缠绕着的磁带。
“众所周知,磁带可以在沙漠中存放 40 年依然可恢复,”IBM 存储策略师 Shawn Brume 说。“2010 年,当 [Nimbus 卫星项目] 的所有数据都从当时已经存放了 46 年的磁带中恢复出来时,磁带的健康状况得到了真正的认识。”
IBM 认为,这一特性使磁带成为存储不需要频繁访问的归档数据的理想介质。磁带还可以作为“气隙”(air gap)备份——一种重要的或敏感文件的离线版本,能够抵御网络攻击。Brume 指出,存储在磁带上的数据类型包括财务记录、医疗记录、个人身份信息以及因法律诉讼而被保留的文档。
除了提供针对不断演变的网络威胁的保护,它在能源消耗方面也更为节约。“数据处于静止状态时,磁带不消耗任何能源。即使在检索文件时,其能耗也非常低,因为它并不追求高性能,”Brume 说。
IBM 磁带的规格
那么,磁带究竟能做什么?
单盘磁带尺寸约为 3 英寸 x 3 英寸,厚度为 3/4 英寸。它比硬盘驱动器(HDD)小,但重约 0.6 公斤(略多于一磅)。一个磁带盒在未压缩的情况下可存储 18 TB 数据,压缩后可存储 45 TB 数据。IBM 正在努力在下一代技术中将容量翻倍。
磁带库的大小可以从可以放在桌子上的尺寸,到类似小型冰箱(约 8 平方英尺)的尺寸。小型冰箱大小的磁带库可以容纳 1,584 个磁带盒。IBM 声称其 Diamondback 磁带库将是市场上最密集的磁带库。它将能够存储 69 PB 信息,同时仅占用不到 8 平方英尺的空间。
“一个磁带驱动器一次只能输出一个数据流,访问数据需要等待一小会儿,但数据仍然可以相当快地传回:每秒 1000 兆比特(压缩后),”Brume 说。
磁带与其他存储技术的对比
Brume 表示,在一个高度数字化的世界里,磁带是少数利用模拟信号来移动部分数据的技术之一。“从根本上说,磁带在很多方面都类似于 HDD。它使用基于磁性的材料。但在这种情况下,磁带实际上是一种材料(通常是尼龙)的衬垫,上面有磁性涂层。与旋转的磁盘不同,磁带会被送入,然后穿过。它可能看起来像录像带,但要坚固得多。”
磁带线性地进入磁带驱动器,然后进入磁带盒。要写入数据,磁头会获取电子信号并产生一个微小的磁场,改变胶片上材料的极性,从而形成零和一的模式。一旦数据被写入磁带,就无法更改(但可以擦除并重写)。
IDC(一家 IT 市场情报公司)的基础设施软件平台研究副总裁 Phil Goodwin 表示:“LTO 磁带(一种开放标准的磁性磁带数据存储技术)的不可篡改性和加密能力,以及创建‘气隙’(取出磁带并将其存放在保险库中)的简单性,使磁带成为在勒索软件面前确保数据生存的关键武器。”
尽管看起来如此,但磁带实现其存储容量的技术实际上非常先进。“这些技术包括先进的超薄塑料基板、复杂的 multichannel 磁头、采用巨磁阻效应的先进读取传感器、先进的跟踪系统以及钡铁氧体颗粒等新颖介质,”卡内基梅隆大学电气与计算机工程教授 James Bain 说。
HDD 以同心圆路径写入数据,而不是线性路径。这意味着使用 HDD,磁头可以轻松地移动到磁盘上的某个位置以便于访问数据,而磁带的检索速度较慢。“当然,我们所有人都比闪存慢,因为闪存只是已经充电的电子,”Brume 指出。
然而,磁带的优势在于它永远不需要充电。“你可以把磁带放在架子上,”Brume 说。“如果一个 HDD 长时间不通电,磁头会粘上一些黏糊糊的东西,然后就无法写入或读取了。”
此外,即使长时间存放,存储在磁带上的数据的完整性也不会真正下降。“如果你有一台笔记本电脑,并且里面有一个 HDD 很长时间,你会注意到它读取速度很慢,”Brume 说。“磁带没有这个问题。磁带的设计就是为了不被频繁访问。”
尽管有这些好处,Brume 认为磁带、HDD 以及更具推测性的数据存储形式,如DNA,在技术生态系统中都有其各自的地位。这一信念得到了该领域一些专家的呼应。
Bain 说:“关于磁带的信息是,就像 SSD 没有取代 HDD 一样,HDD 也不会取代磁带系统。所有这些都在分层存储架构中共存,在系统的每个级别平衡成本和延迟。随着数据中心的增长,这些分层方法变得更有意义,因为财务风险也随之增高。”
IBM 磁带团队是 DNA 存储联盟的成员。“我们非常热衷于此,因为它代表了另一个层次。就像 HDD 和磁带之间的区别一样。HDD 比磁带快,如果你了解 DNA 的技术,你会发现其传输速度是每秒 2 兆比特,”Brume 说。“但如果你需要保存数据,并且需要多个副本,而且你不需要快速检索,但需要永久保存,DNA 将是未来一个很好的选择,因为它非常开放。我们非常了解它。我们知道如何将其映射出来。”
对于那些使用激光蚀刻玻璃盘进行数据存储的创新者来说,Brume 表示他们仍然需要解决为激光创建冷却环境的挑战,以及所需的功率和激光量。
Bain 认为,尽管全息、烧蚀玻璃或 DNA 等竞争技术很有吸引力,但他认为其中仍然有一些需要解决的问题。“像 DNA 这样的东西非常有吸引力,因为它们能够实现的密度可能非常高,”他说。“然而,任何存储系统都必须解决其他一系列问题,例如读写机制、延迟、鲁棒性、错误纠正和冗余等。”
哪些公司仍在其运营中使用磁带
超大规模企业——即那些已经发展到提供自有基础设施,或因其基础设施而拥有海量数据的公司——始终需要多种技术形式来处理进入其系统的各种数据,以支持一系列服务。
这些组织包括 CERN,以及亚马逊、谷歌、Meta、百度、阿里巴巴和腾讯等公司。
IDC 研究经理 Johnny Yu 表示:“在寿命、财务成本和碳足迹方面,磁带优于硬盘和闪存,但在访问速度上则不如。你不会想把实时生产数据甚至备份放在磁带上,但它非常适合任何需要长期保留的、不常访问的数据,例如医疗记录或归档数据。”
IT 分析公司 ESG 的数据管理与分析业务总监 Christophe Bertrand 指出,数据量从未缺少。“磁带是一种独特的介质,可以相对快速地存储大量数据。”他表示,对于这类有价值但访问频率不高的数据(如渲染系统、分析、模型和模拟)的新用例也一直在涌现。
Bertrand 表示,随着企业推动供应商满足可持续性要求,磁带因其低功耗和可回收性而变得越来越受欢迎。他指出,从长远来看,磁带在该领域肯定会面临更多竞争,但“这种新技术需要多长时间才能成熟,并达到合理的规模和价格点?”