

十年前,当科学家们测序人类基因组时,这有点像在看一本外语的蓝图——所有东西都标记在正确的位置,但没有人知道它们意味着什么。我们基因组中只有大约 1% 的部分编码了实际起作用的蛋白质,因此我们 DNA 的其余部分就像生物学上的暗物质,以神秘的方式发挥作用。现在,经过多年的巨大努力,科学家们认为他们得到了一些答案。
一项名为 ENCODE(“DNA 元素百科全书”)的为期五年的项目发现,人类基因组中约 80% 的部分具有生物学活性,影响着附近基因的表达方式以及在哪些类型的细胞中表达。研究人员说,这并非之前认为的“垃圾 DNA”,而是这些非编码 DNA 区域可能对疾病和基因突变有重大影响。
该项目将改写教科书,将人类基因组的建筑蓝图转变为一个控制图和说明手册,解释基因如何开启和关闭。这些规则决定着从胚胎发育到衰老过程的一切。
麻省理工学院的计算机科学教授 Manolis Kellis 是参与 ENCODE 项目的数百名科学家之一,他解释说,该项目揭示了构成我们个体差异的核苷酸差异。
他告诉MIT News:“ENCODE 允许你对基因组的每个核苷酸的功能进行注释,这样当它发生突变时,我们就能对突变的后果做出一些预测。”
ENCODE 对构成基因及其调控区域的全部 32 亿个 A、C、G 和 T 核苷酸进行了注释。它发现了一些有趣的化石区域——我们进化史的 DNA 遗迹——并表明其中一些“假基因”并非完全休眠,而是作为非编码 RNA 仍然活跃。在过去的五年里,超过 400 名研究人员进行了 1600 多次实验,使用了 150 种类型的人体组织,以阐明所有这些活动。据美联社报道,如果以图形形式呈现 ENCODE,迄今为止生成的数据将填满一张长 30 公里、高 16 米的海报。
ENCODE 项目的发现本周发表在《自然》、《科学》和其他期刊的 30 多篇科学论文中。
该研究最有趣的方面似乎是基因调控的惊人强大功能。可能导致疾病的 DNA 变异并不总是与基因本身相关,这从基因治疗的角度来看很有趣。相反,它们通常与调控这些基因的 DNA 片段相关。有时调控片段与被调控的片段很近,但有时它们离得很远——至少从线性的角度来看是这样。
您可以通过《自然》提供的这个交互式浏览器探索这些结果,从中可以学到大量信息和见解。人类基因组只是一个开始。
[AP, ScienceDaily]