从迄今最完整的人类基因组图谱中,我们可能会学到关于胚胎和进化的什么

新测序的重复 DNA 在生物学中扮演着一个理解不清但基础性的角色。
Blue oblong shapes marked with red dots against a background.
人类基因组的更新序列将使科学家能够研究染色体中神秘区域的多样性,例如此处以红色高亮的端粒。Thomas Ried, NCI 癌症研究中心,国家癌症研究所,美国国立卫生研究院

上周,来自二十多个研究机构的研究人员宣布,在耗时 30 年的人类基因组高质量序列绘制工作中取得了一项突破。尽管人类基因组计划的首个草图在 20 年前就已经完成,但仍有近 8% 的人类 DNA 仍是未解之谜。如今,几乎基因组的每一个部分——除了 Y 染色体——都已被解读。

新绘制的区域将为遗传学家提供一个窗口,窥视曾经被描述为“垃圾 DNA”的基因组区域。现在人们认识到,这些区域对进化、胚胎生长以及细胞如何复制和死亡起着基础性作用。

“我们发现,情况比我们以往所能想象的要多样得多,”康涅狄格大学比较生物学家、该序列的合著者 Rachel O’Neill 说。之前的研究结果“就像是在研究地球上的文化、音乐和语言,却忽略了整个非洲。”

所有未完成的部分之所以保持神秘,是因为它们是由复杂的 DNA 重复序列组成的。这段遗传物质可能包含一个重复了数千次的、长达一千个字母的序列。“它们是通过重复进化的,”加州大学圣克鲁兹分校的计算生物学家、新序列的合著者 Benedict Paten 今年早些时候在接受《流行科学》采访时表示。

极端的重复性使得测序尤为困难。尽管与二十年前首次重建人类基因组时相比,基因测序的速度更快、成本更低,但目前最常用的技术涉及读取基因组的短片段。这些片段通过匹配 DNA 序列的重叠处来组装成完整的图景。要拼凑出重复的部分,就像是在拼一幅斑马群的拼图。研究人员不得不开发读取极长 DNA 链的工具,并编写新的算法来完成最终的图景。

[相关:人类多样性的基准基于一个男人的基因组。新工具可以改变这一点。]

历史上,遗传学家将基因组的大部分区域(包括新测序的区域)描述为“垃圾”。绝大多数遗传学研究都集中在基因上,这些基因是相对微小的 DNA 片段,它们被转录成 RNA,然后翻译成蛋白质,即生物体的分子“主力军”。垃圾 DNA 占整个基因组的 98%,但不会被翻译成功能性蛋白质。“如果你只对基因到蛋白质的通路感兴趣,那么其他一切都是垃圾,”O’Neill 说。

但在过去的二十年里,生物学家们意识到,这些“垃圾”中包含的信息对我们所知的生命至关重要——这就像是了解到图书馆的书架上也写满了文字。“一个人眼中的垃圾是另一个人眼中的宝藏,”O’Neill 说。“我属于宝藏那一类。”

人类基因组被组装成 46 条染色体,这些 X 形的“图书馆”由缠绕的 DNA 组成。新序列涉及了这些染色体的三个部分:端粒,染色体的“端帽”,可以防止 DNA 磨损;着丝粒,每个染色体中间的致密 DNA 结,对 DNA 复制至关重要;以及染色体“臂”中的 DNA,用于构建称为核糖体的蛋白质工厂。

新研究对端粒、着丝粒以及几个染色体“臂”中的重复区域进行了高质量的 DNA 测序。Zaleskyphoto/Deposit Photos

虽然这些 DNA 不会产生蛋白质,但它们可以产生 RNA。虽然 RNA 通常被认为是纯粹的信息载体,但它也可以积极地参与细胞活动,附着在其他分子上并促进化学反应。(这就是为什么一些进化生物学家认为,最早的生物完全由 RNA 构成,RNA 同时包含蓝图和复制工具。)

在着丝粒中,RNA 帮助在染色体复制时管理它们。没有 RNA,整个基因组都会崩溃。在“端帽”端粒中的 DNA 会产生重复的 RNA 链,这些 RNA 链可以保持端部的连接,并且似乎在细胞衰老过程中起作用,通过修补磨损的端粒。

指导核糖体构建的 DNA,称为 rDNA,可能具有类似广泛的作用。高中生物学教科书通常将核糖体描述为读取 RNA 并吐出蛋白质的“笨机器”。但斯坦福大学的遗传学家 Maria Barna(未参与新序列的绘制)解释说,不同的核糖体似乎具有略微不同的功能。

关键仍然是 RNA。由 rDNA 编码的四种“物种”的核糖体 RNA 被编织到工厂的结构中。不同的 rDNA 区域会产生略有不同的亚型。“从端粒到端粒的数据中,现在正出现的是 rDNA 存在巨大的多样性,”她说。“近 25% 的 rDNA 可能存在变异。”

Barna 说,并非所有这些变异都会实际进入核糖体。但这些多样性可能在各种事物中发挥作用,从为神经元提供超精确的核糖体来构建特异性蛋白质,到允许肿瘤生长。“我们现在拥有一个初步的目录,列出了这些变异的可能性,这些变异可能应用于正常的细胞分化以及疾病状态,”Barna 说。

重复序列的结构可能很重要。这些重复序列可以进化得非常快,从染色体跳到染色体,或者移动整个基因。即使是密切相关的生物,其着丝粒和端粒也可能存在极大差异——这表明它们在物种形成中起着作用。

“这是一个悖论,”O’Neill 说。“我们与野兽共享的最保守的功能之一,也是染色体中最具差异性的部分之一。” 悬而未决的问题是,所有生命中最基础的部分如何同时又如此灵活。

 

更多优惠、评测和购买指南

 
Philip Kiefer Avatar

Philip Kiefer

特约撰稿人

Philip Kiefer是《Popular Science》的特约撰稿人。他于2021年开始作为自由撰稿人加入科学部门,同年晚些时候正式成为团队一员。他曾报道过COVID变种的演变、食腐蜜蜂以及史前藻类爆发。


© .