

1736 年,瑞士数学家莱昂哈德·欧拉(Leonhard Euler)通过绘制一张图结束了普鲁士科尼斯堡市民们的一场辩论。普列戈利亚河将这座城市(现为俄罗斯加里宁格勒)分成了四个区域,七座桥梁将它们连接起来。一个人能否在不重复走同一座桥的情况下,走遍所有七座桥?
欧拉从一张地图开始,他清除了所有与手头问题无关的东西——房屋、街道和咖啡馆。然后,他将这张地图转化成了更为抽象的东西,描绘的不再是物理地点,而是一个相互连接的系统。四个区域变成了点,七座桥梁变成了线。通过将科尼斯堡转化为数学家们后来称之为抽象的简单节点和边,欧拉得以对该系统进行数学分析。他证明了,一个人不可能在不重复走同一座桥的情况下走遍所有七座桥。更重要的是,他第一次绘制了一张网络图。
在接下来的两个世纪里,科学家们在欧拉工作的基础上发展了图论,这是后来成为网络科学基础的数学分支。但直到 1959 年——匈牙利数学家保罗·艾狄胥(Paul Erdös)和阿尔弗雷德·雷尼(Alfréd Rényi)提出了复杂网络演化的方法——网络理论才开始形成。直到 20 世纪 90 年代中期,科学家们才开始将这一理论应用于真正复杂的问题。在那之前,大型数据集难以获取,处理起来更加困难。但随着数据越来越容易获取,处理能力越来越便宜,研究人员开始将图论应用于从蛋白质相互作用到电网运行的一切领域。
罗马尼亚出生的物理学家、圣母大学的阿尔伯特-拉斯洛·巴拉巴西是这些研究人员之一。在过去的十几年半里,他至少两次改变了同事们对网络的理解方式。他的理论影响了工程、市场营销、医学和间谍活动的重要发展。他的研究可能很快就能让工程师、营销人员、医生和间谍不仅理解和预测网络行为,还能控制它。
巴拉巴西的研究可能很快就能让我们不仅理解和预测网络行为,还能控制它。然而,起初,巴拉巴西和欧拉一样,主要对描绘复杂系统感兴趣。他特别关注埃狄胥-雷尼模型,该模型认为复杂网络是随机的,如果网络足够大,随着时间的推移,每个节点都会有大致相同的链接数量。1998 年,巴拉巴西和他在圣母大学的学生有机会研究一个非常大的数据集——圣母大学网络域下的 325,000 个页面——对该理论的影响。当他们进行计算时,几乎所有页面确实都有大约相同的链接数量。但有几十个例外,它们的入链数量超过 1,000 个。当时,谷歌的 PageRank 已经利用这种特性来产生更相关的搜索结果,但对于网络理论家来说,这种概念是激进的,并且对网络之外的领域产生了影响。巴拉巴西后来写道:“我们瞥见了网络中一种新的、出乎意料的秩序,它展现出非同寻常的美丽和连贯性。”
面对埃狄胥-雷尼模型与他的发现之间的矛盾,巴拉巴西绘制了其他几个大型复杂系统,包括计算机芯片上晶体管之间的连接以及好莱坞演员之间的合作。在每种情况下,高度链接的节点,即他称之为“中心”(hubs),是网络的决定性特征,不仅是异常,而且是工程和自然系统共有的组织原则。巴拉巴西与他的学生蕾卡·阿尔伯特(Réka Albert)一起,更新了埃狄胥-雷尼模型,以反映现实世界网络中中心的存在。通过这样做,他创造了一个工具,使科学家们能够以前所未有的方式绘制和探索各种复杂的系统。
巴拉巴西关于中心的论文迅速发展成一篇关于中心的论文,成为网络科学领域被引用最多的论文之一。他将其改编成一本畅销书《Linked》,后来在东北大学成立了自己的实验室。其他领域的科学家开始借鉴中心理论。癌症研究人员利用它来更好地理解蛋白质网络如何抑制体内的肿瘤;生物学家在巴拉巴西的帮助下,利用它来确定耐药细菌代谢网络中的抗生素靶点;这项研究可能为药物发现提供一条全新的途径。巴拉巴西说,甚至有迹象表明,情报界正在利用他的工作来绘制恐怖网络图。“这只是措辞的问题,”他说。“有很多小暗示表明他们正在使用它。”但他的见解在应用方面的转化并没有让巴拉巴西持续太久。他是一名理论家,而不是应用科学家。他说,一旦他能够绘制一个系统,他的下一个挑战就是预测它的行为。
2006 年,巴拉巴西有机会进行预测研究。那一年,有人打电话给他,提出了一个不同寻常的提议。他说他代表一个欧洲手机联盟,他坚持要求该联盟匿名,并且他拥有一个引人入胜的数据宝藏:六百多万用户的匿名记录。如果巴拉巴西同意挖掘数据以了解客户为何更换供应商,他也可以将其用于自己的学术研究。
巴拉巴西接受了提议。通过研究通话记录和每个号码的付款详情,他和他的实验室成员确实能够构建一个算法,识别出可能更换供应商的客户。然而,在探索数据时,他还发现该算法识别了用户打电话时访问的手机信号塔,这使他能够估算通话者的物理位置。
几个世纪以来,物理学家一直在预测粒子和行星的运动,但他们从未成功预测过人的来去。巴拉巴西和东北大学的物理学家宋长明(Chaoming Song)假设,如果他们将这些通话者视为粒子,他们就可以预测一个人在任何给定时间的地点。他们编写了软件来绘制 50,000 名通话者的移动轨迹。每个信号塔都变成了一个节点。当用户从一个节点移动到另一个节点时,路径由一条边标记。然后,他们得出了每个个体的熵,熵衡量系统中随机性或不确定性的程度。通过结合移动数据和熵数据,巴拉巴西和宋发现,他们可以预测一个人在一平方英里范围内的位置,准确率高达 93%。即使是那些经常在正常活动范围外旅行的人,其可预测性也不低于 80%。
研究人员才刚刚开始将巴拉巴西和宋的发现整合到实际应用中。流行病学家利用航空旅行数据来预测疾病在城市之间的传播。巴拉巴西和宋的发现可以让他们在单个街区内进行定位。预测人们的移动方式、时间和地点,可以帮助交通工程师找到缓解拥堵的方法,并帮助城市规划者设计能够应对大量移民工人涌入的发展中世界的城市。2009 年,巴拉巴西和几名学生利用预测算法解释了为什么手机病毒目前并不普遍,但一旦足够多的手机受制于单一操作系统,它们就可能构成严重威胁。
预测科学确实存在缺点。在发表了他的研究之后,巴拉巴西收到了大量电子邮件,指责他为“老大哥”应用打开了大门。当局可以利用他的算法结合手机上收集的 GPS 数据,以惊人的精度跟踪和预测公民的行踪。如果人们能够预测系统内的行为,他们是否也可能找到控制它的方法?

2009 年,当他访问明尼苏达大学介绍他的工作时,巴拉巴西一直在思考控制的问题。在讲座前不久,他与一位工程师进行了交谈。“五分钟后,我清楚地发现他对我所做的工作一无所知,”巴拉巴西说。“所以我问,‘你做什么?’他说,‘我是一名控制论专家。’”
工程师们利用控制理论来预测系统对各种输入的反应,这反过来又能帮助他们制造出能够接住棒球的机器人、能够轻松过弯的汽车以及不会从空中坠落的飞机。巴拉巴西从未听说过它,所以他新认识的朋友带他到一块白板前,画出了基本方程。巴拉巴西注意到这些方程与他用来绘制网络的方程非常相似,于是他决定将它们纳入自己的工作中。
与预测一样,控制也需要将一个物体评估为一个具有不同重要性节点的系统。例如,一辆汽车:“它由 5,000 个组件组成,”巴拉巴西说,“但你作为驾驶员,只能接触到三到五个节点”——方向盘、油门、刹车,可能还有离合器和换挡杆。“有了这三个到五个旋钮,你就可以让这个系统去任何汽车能去的地方。”他想知道的是,他是否可以查看任何网络,而不仅仅是工程网络,并找到那些控制节点。在细胞内运行的数千种蛋白质中,他能否找到方向盘、油门和刹车?
在细胞内运行的数千种蛋白质中,巴拉巴西能否找到方向盘、油门和刹车?巴拉巴西请他的实验室成员、物理学家刘阳宇(Yang-Yu Liu)以及麻省理工学院的控制论专家让-雅克·斯洛廷(Jean-Jacques Slotine)帮助他定位网络中的“控制节点”。控制节点从网络外部接收指令或信号(例如,脚踩油门),并将它们传递给网络内部的节点(燃油喷射系统)。为了找到它们,刘借用了一个由艾狄胥和雷尼五十年前开发的算法,该算法充当信号在网络中移动。它从一个节点开始,沿着随机的边移动到另一个节点,此时它“擦除”除其进入和将要离开的边之外的所有其他边。该算法反复运行整个网络,直到找到到达系统中每个节点所需的最小起始点集。控制这些起始点,就等于控制整个网络。
该小组在 37 个不同的网络上测试了该算法,包括监狱人口中的联盟星座图、酵母的代谢途径以及几个互联网社区,包括 Slashdot 和 Epinions。他们发现,更密集、更互联的网络倾向于每人拥有更少的控制节点。例如,备受研究的线虫 C. elegans 的大脑,一个由 297 个神经元组成的网络,只有 49 个控制节点。酵母细胞中基因的网络会产生 4,441 种蛋白质,但巴拉巴西发现他需要控制其中 80% 的蛋白质,即 3,500 种,才能控制该系统。
这听起来像是太多的点,不太有用,就像一辆有 3,500 个方向盘的汽车,但巴拉巴西指出了两点:虽然 C. elegans 的神经元图谱是完整的,但科学家们只确定了酵母细胞基因网络中约 5% 的连接。科学家们向模型输入的数据越多,他们就能更好地绘制网络连接图,而可能需要的操作系统的控制节点就越少。“我们知道这些地图是不完整的,”巴拉巴西说。“但它们每天都在变得更加丰富。”他还表示,他的理论适用于对网络的完全控制。想要部分控制的科学家——例如,在细胞内诱导特定蛋白质表达——只需要掌握少得多的节点。
与巴拉巴西的大多数工作一样,使其有用还需要时间。找到控制点是一回事。实际影响给定的网络,无论是 Facebook 还是人体免疫系统,是完全不同的挑战。
最早的突破很可能发生在医学领域。通过识别细胞生长系统中的控制节点,科学家们可以将成熟的细胞恢复到其胚胎状态,从而创造新的干细胞来源。“一些疾病都与缺乏控制有关,”巴拉巴西说。“如果你能够在细胞或神经元层面获得对它们的控制,你可能就能治愈疾病。”
当然,控制既可用于善,也可用于恶。营销人员可以学会更好地操纵消费者,政府可以开发新的技术来恐吓公民。巴拉巴西说,由我们来决定控制应该如何应用,如何不应该应用。“我们必须认识到,控制是理解过程的自然发展,”他说。“但控制是一个意愿的问题,意愿可以通过法律来控制。我们必须作为一个社会共同努力,弄清楚我们可以将它推进多远。”