在我们开始尝试找出哪些大型科学项目实际上是世界上最大的科学项目之前,我们必须先设定一些参数。第一,项目必须已经投入运行,而不是处于规划或建设阶段。第二,我们决定不包含那些生命周期即将结束的项目,比如将会在 2011 年 9 月停止运行的 Tevatron。最后,我们认为像斯瓦尔巴全球种子库(尽管它很酷)这样的项目不符合标准,因为它们不主要涉及生成新数据。
这样一来,我们就剩下大约 20 个候选项目。我们收集了这 20 个项目的各项统计数据,包括年预算、估算建设成本(我们将其换算成 2011 年美元)、员工人数和物理规模。我们将每个类别分解成不同的数值范围,以便计算更轻松一些。
我们希望确保最终得到一个清晰的 1-10 排名,而不是出现例如前十名并列的情况。为了避免这种情况,我们必须确保我们的范围不会将项目过于集中在少数几个等级中。以预算为例:像“海王星”(每年 1200 万美元)这样规模较小、成本相对较低的项目,与像国际空间站(每年 20 亿美元)这样规模宏大、成本高昂的项目之间存在巨大的差异,这迫使我们查看整个数据集,找出哪些项目是异常值。否则,如果我们只是将数据范围分成 10 个相等的部分,我们可能会在第 1、2 和 10 个等级中聚集大量项目,而在中间的等级中则没有项目。我们计算了每个类别中每个数据点的平均值、标准差和 z 分数。z 分数表明一个给定的数据点与平均值的距离有多远,这表明一个数字在给定的数据集中相对于其他所有数字是异常大还是异常小。我们剔除了 z 分数异常高(或低)的项目,不对它们进行等级范围的计算。
完成这些之后,我们将每个项目及其量化数据放入不同的等级。z 分数高的项目自动被放入第 10 级,z 分数低的项目则被放入第 1 级。
在处理完每个项目的具体数字后,PopSci 的工作人员和研究员 Brooke Borel 接着挤在一家寒冷的会议室里,讨论我们“定性”(读取:完全主观)的类别。我们决定了三个类别:科学效用、对你的好处和震撼因素。然后,我们在三个主观类别中,以 1 到 10 的评分尺度对所有项目进行排名。这引发了一些有趣的争论,在有科学背景的人和有新闻背景的人之间形成了明显的区分。该杂志的生物学家、化学家和物理学家非常看重那些名字听起来很无聊的项目,比如“散裂中子源”,因为它们最终会对许多科学分支产生巨大贡献,但其他工作人员在提到这些项目时开始发出鼾声(因此它们的“震撼因素”得分较低,但“科学效用”得分较高)。我们都很喜欢那个自杀式飞往木星的探测器,因为撞向太阳系中最大行星是件很酷的事,但它的“对你的好处”得分却不高,因为说实话,我们都不可能很快登陆木星。
最后,我们投票决定了七个类别(四个客观类别和三个定性类别)的权重。我们将三个定性分数都定为 1,因为我们认为它们对普通读者来说最重要。建造成本为 0.75,因为大型项目往往成本很高。员工人数、物理规模和年预算的权重均为 0.5,这表明我们认为这些因素不像其他因素那么重要(或者,在年预算的情况下,我们不想给予金钱事项过多的权重)。一旦确定了这些,就只需运行计算,即可得出每个项目的总分。