

Backblaze 的第一台服务器建于 2007 年,装在一个胶合板箱子里。如今,这家致力于提供个人云备份的公司,总共存储了 200 PB 的数据。(相当于 2 亿 GB。)
然而,这家云存储公司不像亚马逊、微软和谷歌等行业巨头。Backblaze 依靠自己设计的服务器,称为 Storage Pods(存储舱),以十分之一的成本自己建造服务器。这些设计是公开的,并且建造它们的说明在 Backblaze 的网站上免费提供。
在过去的两年里,微软、Facebook,最近还有谷歌都加入了开放计算项目(Open Compute Project),该项目致力于将这些相同类型的设计开源。但 Backblaze 自 2009 年以来一直在这样做,并且已经建立了一个依赖于他们特定构件的商业和技术爱好者社区。从小型制造商到 Netflix,他们的服务器设计都被广泛使用。
如今,Backblaze 正全力以赴与最大的竞争对手正面交锋。Until now(直到现在),该公司一直专注于备份个人电脑,并为大型企业提供云存储,但有一些严格的文件大小限制。今天的公告表明,Backblaze 现在将支持高达 10TB 的单个文件,以及一系列为企业客户提供的 API 和插件。之前,他们支持的最大文件大小为 5GB。他们称之为“大文件测试版”(Big File Beta)。
像亚马逊的 S3 服务和微软的 Azure 这样的公司,传统上一直主导着大型企业存储市场,因为公司需要 TB 级存储来备份海量服务器文件。但 Backblaze 押注,通过在某些领域更便宜、更强大,它可以从这些巨头那里分一杯羹。在谷歌、亚马逊、Verizon 或 Rackspace 上存储文件,每 GB 的成本从 0.20 美元到 0.75 美元不等,而在 Backblaze 上,成本仅为 0.005 美元。
目前,10TB 是亚马逊和谷歌提供的最大文件存储容量的两倍,是微软的十倍。这意味着,当一家公司想要将整个数据库备份为一个单独的文件时,他们就可以做到。或者,他们可以将巨大的文件保存在 Backblaze 的服务器上,从而减轻自身服务器的负担。
Backblaze 的首席执行官 Gleb Budman 解释了该公司如何专门构建服务器来处理大文件。
Budman 说:“你永远无法将一个 10TB 的文件放在一个硬盘上。但由于我们拥有整个云文件系统,我们在后端会把文件切成小块,并将它们存储在不同的存储舱、不同的服务器架上的不同硬盘上。”
这种将一个文件分布在多个硬盘上的方法称为纠删码,这种方法并非 Backblaze 独有。但文件大小是。
这种方法并非 Backblaze 独有。但文件大小是。
Budman 说,其他公司购买的服务器在架构上有所不同,因为它们需要能够独立运行,无论客户购买一台服务器还是十台。由于 Backblaze 知道它构建的服务器将添加到其系统中,因此它可以针对这种分布式计算进行优化。
当 Backblaze 收到任何文件时,无论是 10KB 还是 10TB,公司都会将其切成 20 块。需要其中 17 块才能将文件重新组合起来。剩余的三块包含冗余数据,以防丢失原始的 17 块文件。Budman 说,即使一个硬盘、一个存储舱甚至一个整个服务器架丢失,这个系统也能确保所有数据都可以恢复。
但是,尽管企业业务竞争激烈,Backblaze 仍将公布其所有设计。
Budman 认为,小型开源社区是 Backblaze 取得成功的重要原因之一。除了将设计贡献给社区所产生的良好声誉,他们还能获得回报。
Budman 说:“每当我们发布新版本的 Storage Pod 设计时,我们都会收到很多评论,人们会问‘嘿,你们尝试过这个吗?’或者‘你们看过这个组件吗?’。开源 Storage Pods 是一个风险和赌博,但结果却非常棒。”
最近,社区指出 Backblaze 使用的一个组件——电源按钮——价格过高。听到这个消息后,公司着手寻找新的开关,最终节省了超过 10,000 美元。这被 记录在 Reddit 的一个帖子中。
另一方面,Backblaze 还曾依赖一家公司专门生产一个称为 背板(backplane)的组件。背板就像电脑的主板,是连接 PC 组件的集线器。然而,由于他们开源了背板的设计,另一家公司已经开始生产,为 Backblaze 提供了另一个潜在的供应商。
尽管竞争对手也通过开放计算项目加入开源浪潮,但 Budman 表示,这些方法仍然不同。例如,Backblaze 服务器的制造成本仍然更低,因此公司可以降低成本,但在 Storage Pod 使用过程中无法更换硬盘。
在阿拉斯加的费尔班克斯,阿拉斯加地理信息网络(GINA)已经建造了三个 Storage Pods。GINA 的技术服务经理 Dayne Broderson 说,他们需要随时为地图绘制师、科学家、教授和学生提供多年的卫星图像和大型数据集,而且作为一个小型组织,资金可能会很紧张。
Broderson 说:“如果我需要几 PB 的旋转存储,[Storage Pod] 可能是最具成本效益的选择。”
然而,他说 Storage Pod 解决方案可能并不适合所有人。由于它不是一个开箱即用的解决方案,服务器的设置和维护可能很耗时。幸运的是,GINA 在第一次构建时可以依靠学生劳动力,尽管花费了很长时间。Broderman 说,让一名学生和一名教职员工(尽管不是每天)建造服务器花了 4-5 个月,期间还意外烧坏了组件。他将其归结为一次学习经历。
Broderman 说:“你烧坏了东西,从中吸取教训,这很好,但订购那个价值 8 美元的零件也要花一周时间才能继续下一步。”