

1990 年,人类基因组计划启动,被誉为有史以来最伟大的科学事业之一。这项历时 13 年的项目识别了约 20,000 个基因,并为研究人员提供了转化现代医学的基因蓝图。如今,医生可以利用基因信息更好地诊断疾病和衰弱性疾病,例如将 罕见的腿部疼痛与单一基因突变联系起来。这项研究也开启了精准医疗时代的希望,届时每种治疗都将根据个体量身定制。然而,只有一个问题——这项工作并没有真正完成。
这是因为人类有 99.9% 是相同的。但那 0.1% 的基因差异解释了我们的独特性,也可能解释了为什么有些人更容易患病。拥有一张单一基因组的图谱(90 年代项目产生的)并不能充分代表人类人口的广度。
今天发表在 《自然》 杂志上的一项国际研究,通过分析更多样化的基因序列来填补这些空白。“我们正在重新调整基因组学的基础,以创造一个多样化和包容性的人类变异表征,作为基本参考结构,”该研究的资深作者 Benedict Paten 说,他是加州大学圣克鲁斯分校基因组研究所的副所长。
[相关:人类多样性的基准是基于一个男人的基因组。一个新工具可以改变这一点。]
通过消除偏见并分析更具包容性的基因组数据,遗传学家将能更好地理解突变如何影响一个人的基因,并使我们更接近公平医疗保健的未来。
什么是泛人类基因组?
这项研究专注于创建泛人类基因组——一个物种内的 DNA 序列集合。过去的工作侧重于一个参考基因组,它由少数个体构建,旨在代表更广泛的基因集合。而泛人类基因组则由世界各地多个个体创建,以更准确地反映我们基因的多样性。
并非过去的遗传学家不想测序更多的基因变异——他们只是做不到。 Erich Jarvis,洛克菲勒大学霍华德·休斯医学研究所的遗传学教授,也是该研究的合著者,他说,90 年代和 2000 年初的技术不允许研究人员观察到个体内部和个体之间单倍体(从单亲继承的一组基因)之间的大型变异。

泛人类基因组的重点是研究来自世界各地个体之间的基因差异。Jarvis 说,了解基因组变异很重要,因为一些突变与不同的性状和疾病有关。例如,脂蛋白 (a) 基因具有复杂的结构,尚未在人类中测序。但已知该基因的变异与 黑人患心脏病的风险增加有关。通过测序整个基因并理解其变异,医生或许能够重新审视并治疗以前无法解释的冠心病病例。
“这篇论文帮助我们理解 DNA [不仅仅] 是字母序列;DNA 是结构化组织的,人类的这种结构变异对基因组功能和性状多样性很重要,” Sarah Fong 说,她是加州大学旧金山分校研究人类种群变异的博士后研究员,她没有参与这项研究。
第一个草案揭示了什么?
作者收集了 47 个基因多样性个体的 DNA 数据。大约一半来自非洲,其余代表其他四个大洲(不包括澳大利亚和南极洲)。基因组信息增加了 1.19 亿个碱基对和 1,115 个重复序列的信息——即基因的一部分 DNA 被重复的突变。不出所料,99% 以上的基因序列在个体之间是相似的。但通过纳入这个新的泛人类基因组草案中不到 1% 的变异,作者发现基因的结构变化解释了已识别的 9000 万个碱基对。
[相关:从迄今为止最完整的人类基因组图谱中,我们可能会学到关于胚胎和进化的什么?]
“通过超越基因组的单一、任意和线性的表征,泛人类基因组参考联盟的工作更准确地描述了我们物种中存在的 [基因] 多样性,” Rajiv McCoy 说,他是约翰霍普金斯大学的生物学助理教授,他没有参与当前的研究,但最近参与了 人类基因组的首次完整测序。
借助最新的泛人类基因组模型,遗传学家可能更容易检测和表征难以发现的基因突变。当作者使用泛人类基因组草案作为参考分析另一组基因信息时,他们检测到的结构变异增加了 104%。他们还提高了比较序列的准确性,将变异错误率降低了 34%。
仍在进行中
创建泛人类基因组的第一个草案只是这个分两部分项目的第一阶段。第二阶段将需要几年时间,因为作者将与其他国际研究人员建立合作关系,并在基因组数据较少的地区进行社区外展,例如纳入土著文化成员。
Fong 说,可能需要几十年时间,这些草案才能最终形成完整的人类基因组图景。他说,有几个挑战需要解决,例如开发一种有效的策略来比较多个 #-} 人类基因组,以及在医学领域进行基因变异测试的具体计划。
尽管如此,Fong 说,这些努力是值得的。拥有完整、多样化的人类基因组将推动基因学研究的发展,并创造一个在治疗疾病时能更充分考虑人们基因的未来。