


以下摘自 Adam Rutherford 的著作 每个人曾活过的简史。
我们都与众不同,这也意味着我们谁也不与众不同。这仅仅是一个数字游戏。你有两个父母,四个祖父母,八个曾祖父母,以此类推。每一代向前追溯,你的祖先数量都会翻倍。但这种祖先的扩张并非无止境地追溯到过去。如果真是如此,那么在你曾祖父查理曼大帝时期,你的家谱将包含约 137,438,953,472 位个体——比当时、现在或总共活过的人还要多。这意味着,家谱在几代人之后就会开始自我折叠,变得不再像树状,而更像一个网状结构。你可能,实际上也确实,曾多次从同一个人那里继承了血统。你的曾曾曾曾曾祖母可能在你的家谱中占据两次或多次这样的位置,因为她血统的传承线从她那里分支开来,但又最终汇聚到你身上。我们追溯的时间越久远,这些血统线就越会汇聚到更少的人身上。Pedigree(家谱)这个词源自中古法语短语“pied de grue”,意为“鹤的脚”,因为脚趾和拇趾从胫骨底部的一个关节处张开,大致相当于我们的脚踝。这种分支描述了一个或几代的家谱,但当我们向上追溯到过去时,这种描述就完全不准确了。相反,每个人都可以作为一个节点,祖先的过去流淌进他们,而未来则从他们身上喷涌而出,前提是他们留下了后代。
我对此相对容易接受。简单的逻辑是,地球上现在活着的人比过去任何一个时刻都多,这意味着现在活着的人的许多祖先,在过去时是不同的人。但我们怎么能如此确信,任何一个欧洲人,就像克里斯托弗·李(Christopher Lee)一样,都直接遗传自那位伟大的欧洲调解人呢?
答案甚至在我们拥有高科技 DNA 测序和古代基因分析之前就已存在。答案来自于数学。约瑟夫·张(Joseph Chang)是耶鲁大学的一位统计学家,他希望通过数字来分析我们的祖先,而不是通过基因或家谱。通过询问欧洲人最近的共同祖先是谁,他构建了一个数学模型,该模型考虑了每个人假定拥有的祖先数量(每人有两个父母),以及考虑到当前人口规模,所有这些可能的家谱上升线交汇的时间点。答案仅仅是 600 年前。大约在 13 世纪末,生活着一位男性或女性,所有欧洲人都可以追溯到他/她(如果记录允许的话,但实际上并不允许)。如果这听起来不太可能或奇怪,请记住,这个人是你以及现在每个人身上数千条血统线中的一个,无论这位不知名的个人是谁,他/她只占你全部家族网状家谱的一小部分。但如果我们能追溯到 600 年前所有活着的人的全部家谱,在这些错综复杂的纠葛中,所有现存的欧洲人都能找到一条血统线,这条线在理查二世时期与所有其他人的血统线交叉。
如果你再往前推几百年,张的计算结果会更令人惊讶。一千年前,数字们说了一些非常清晰、但又有些令人困惑的事情。一千年前生活在欧洲的五分之一的人,是今天所有活着的没有后代的祖先。他们的血统线在某个时刻消失了,因为他们或他们的后代没有留下自己的血统。相反,其余的 80% 是今天所有活着的人的祖先。所有血统线都在公元 10 世纪汇聚到每一个人身上。
一种思考方式是接受,所有欧洲血统的人在公元 10 世纪应该有数十亿的祖先,但那时并没有数十亿人,所以试着将他们塞进实际存在的那个数字里。由此得出的数学结论是,数十亿的祖先血统线已经汇聚到了不仅是少数人,而是实际上当时所有活着的人身上。因此,可以推断,如果查理曼大帝生活在公元 9 世纪,我们知道他确实如此,并且他留下了今天仍然活着的后代,我们也知道这是真的,那么他就是今天在欧洲所有欧洲血统的祖先。
他有十八个孩子,这对任何时代来说都是一个相当可观的子嗣,这甚至都不重要。如果他只有一个孩子活了下来,并且他的家庭繁衍至今,那么故事也会一样。他有十八个孩子的事实增加了他成为那 80% 的几率,而不是那 20% 的人(他们没有留下 21 世纪的后代),但他的许多同时代人,你都与他们有直接的亲缘关系,他们拥有的孩子不到十八个,有些人只有一个,但他们也都在你的家谱中,毋庸置疑,确定无疑。
至少这是理论。随着易于且廉价的 DNA 测序技术的出现,检验这种数学计算成为可能。DNA 是生物学血统的载体,你从你的两个父母那里继承了你所有的 DNA,大约是 50/50 的比例。他们又从他们各自的父母那里继承了他们所有的 DNA,所以你的 DNA 中有四分之一和你祖父母的四分之一是相同的。如果你有表亲,那么你大约共享 1/8 的 DNA,因为你们有两个共同的祖父母。然而,这些共享的 DNA 片段并不是相同的片段。而且,当你向上追溯你的家谱时,它并不会完美地减半。请记住,DNA 在精子或卵子形成时会被重新组合,每一次重新组合都不同,但这种重组相当粗糙。在重新组合后的牌堆中,也就是你自己的基因组中,很大一部分与你父亲或母亲是相同的。两个人关系越近,他们共享的 DNA 块就越多。这就是为什么同卵双胞胎长得一模一样(所有的 DNA 块都相同),为什么兄弟姐妹和父母看起来相似(他们共享一半的 DNA)。在遗传学中,我们将这些 DNA 片段称为“同源相同”(identical by descent, IBD),它们对于衡量两个人之间的亲近程度非常有用。
2013 年,遗传学家 Peter Ralph 和 Graham Coop 表明,DNA 所说与张的数学祖先分析结果完全相同:我们的家谱根本不是树,而是纠缠不清的网。他们寻找了 2,257 名欧洲人的同源相同 DNA 的长度(为了减弱近期迁移的影响,选定的所有受试者都有四个祖父母来自同一地区或国家)。通过测量共享 DNA 的长度,他们可以估计出那副牌(DNA)是什么时候被重新洗牌的,从而得知两个人有多亲近。计算和 DNA 极大地推动了这一领域的发展,这在他们的数据集和随后的数字分析中得到了体现。
约瑟夫·张的数学计算没有考虑到一个非常明显的事实,那就是我们并非随机交配。我们通常在相同的社会经济群体、小地理区域、共享语言范围内结婚。但对于 Coop 和 Ralph 的基因分析来说,这似乎并没有那么重要。血统的传播速度非常快,基因可以几代人之间迅速传播。你可能会认为,一个偏远的部落,例如在亚马逊地区,会与其他部落隔绝数个世纪。但没有人会永远隔绝,只需要极少数人与基因池之外的人通婚,那些 DNA 就会迅速地在后代中传播。
张在进一步研究欧洲以外的共同祖先时,将这一点考虑在内,并在 2003 年得出结论:今天地球上所有活着的人的最近共同祖先生活在大约 3,400 年前。
他使用了两种计算方法,一种是简单地进行祖先数学计算,另一种则纳入了对城镇、迁徙、港口和人口的简化模型。在计算机模型中,港口有更高的移民率,增长率也更高。输入所有这些和其他因素后,计算机计算出祖先血统线何时交叉,得出的数字大约是公元前 1400 年。它还将那个人定位在亚洲某地,但这更多地与计算迁徙的地理中心点有关。如果这听起来太近期,或者因为南美洲或南太平洋岛屿的偏远人口而令人费解,请记住,没有哪个人口群体已知在一段持续的时间内保持隔离,即使是在那些偏远地区。西班牙人进入南美洲意味着他们的基因迅速传播到被毁灭的原住民部落,并最终传播到最偏远的民族。太平洋中部微小的平格拉普和莫吉尔环礁上的居民,在 19 世纪被发现后,欧洲人已经融入了他们的基因库。即使是像撒玛利亚人这样宗教上隔绝的群体,人数不到 800 人,并且被限制在以色列境内,他们也选择与外界通婚以扩大他们有限的基因库。
当张考虑新的、非常保守的变量时,例如将白令海峡的移民数量减少到每十代一个人,那么今天所有活着的人的最近共同祖先的年龄就增加到 3,600 年前。
这个数字可能听起来不对,当我讲到它时,通常会引起困惑的表情。我们不擅长想象代际时间。在我们的生命中,我们把家庭看作是独立的单位,它们确实如此。但在我们视线之外的更长时期内,它们是流动的、连续的,我们的家谱向各个方向延伸。张的数学研究虽然棘手且技术性很强,但其结论段落却并非如此。这是非常优美的文字,在学术论文中极为罕见,值得全文分享。
你是皇室后裔,因为每个人都是。你是维京人后裔,因为每个人都是。你是撒拉森人、罗马人、哥特人、匈奴人、犹太人后裔,因为,嗯,你懂的。所有欧洲人都是从完全相同的人那里继承血统的,而且并不久远。10 世纪时所有活着且留下后代的人,都是今天所有欧洲人的祖先,包括查理曼大帝,以及他的孩子们德罗戈、丕平,当然,还有休。如果你是东亚人,你几乎肯定会在你的家谱的某个地方找到成吉思汗,就像人们常说的那样。如果你是地球上的人类,你几乎肯定在你的家谱中找到埃及艳后、孔子,或者任何我们能从古代历史中命名出来的人,前提是他们留下了孩子。我们追溯的时间越久远,血统的确定性就越高,但对祖先的了解就越少。这既美妙,又微不足道,又毫无意义,又充满乐趣。
摘自 每个人曾活过的简史 作者:Adam Rutherford。经出版商 The Experiment 授权转载。所有书店有售。