调查人员填补了最后8%的缺失基因信息,为了解疾病的原因和治疗方法以及我们如何代谢药物提供了新的线索。
科学家们用新的英特尔来庆祝人类基因组的里程碑
作者:Marcia Frellick
2022年4月6日 C 人类基因组终于第一次被绘制成端到端的地图,这一历史性的里程碑让科学家们欢欣鼓舞。
"国家人类基因组研究中心临床主任本杰明-所罗门(Benjamin Solomon)博士说:"无论是在基因组学界还是在更广泛的科学和医学界,这都是真正的大事情,令人激动。
100多位科学家填补了最后8%缺失的人类基因信息,并在《科学》杂志上发表了六篇系列论文,以及其他出版物上的配套论文。
所罗门说他的社交媒体在最近几天 "炸开了锅"。
这些论文宣布,作为一个名为 "端粒到端粒"(T2T)的国际联盟的一部分,调查人员在过去20年里填补了缺失数据的空白,并解码了以前无法读取的信息。
早在2003年,研究人员分享了作为人类基因组计划的一部分,人类基因组已经被测序,但在这个信息宝库中存在着空白,在当时是无法获取的。
科学家们说,这缺失的8%可能会揭开诸如细胞如何产生蛋白质、人们如何适应传染病并存活下来、为什么会发生癌症、我们如何代谢药物,以及为什么人类的大脑比猿类和其他物种的大脑更大、更能处理信息等谜题的线索。
了解人类的身体
所罗门指出,许多好处将在很久以后实现,但在近期的改进中,将有一个更清晰的参考集来比较基因缺陷。
他说,这就像玩儿童游戏一样,在两张图片中寻找微小的差异。
由于之前基因组中的空白,参考集更难看清楚,有孔洞、模糊的图像和错误位置的编码,所以更难理解特定病人的案例中哪些是基因上的不同。
"所罗门解释说:"现在我们可以解决一些以前不能解决的病例,因为我们有一个更好的基因组参考集地图。
T2T工作的领导者之一,西雅图华盛顿大学基因组科学教授Evan Eichler博士说,缺失的8%主要是由重复的人类DNA组成的。这些被称为脱氧核糖核酸的基因指令在某些情况下重复了数千次,使得当时的测序技术难以解开它。
新技术带来的发现
艾希勒说,他也是最初的人类基因组计划的一部分,浏览重复的遗传信息 "就像在一个没有出口的环形路上"。随着过去20年的进步,技术现在可以整理出重复的遗传信息,并将这些字母以更长、可读的字符串呈现出来。
他说,人类基因组有23对染色体,有30亿个碱基对,而恢复的8%增加了2亿个新的碱基对,这基本上就像为科学发现增加了一个非常大的染色体。
一个完整的地图可以帮助解释的事情包括一个人患心脏疾病的风险。Eichler说,新的信息可以帮助专家们了解名为脂蛋白(a)的基因。他说,该基因的一部分是高度重复的,那些以前试图对其进行测序的人只是迷失了方向。
"他说:"在过去的20年里,我们一直无法对该基因进行常规测序,主要是因为它的尾部C分子的业务端是由这些长的重复组成的。"现在我们有了第一个完整的副本,"这意味着科学家们可以提出问题,并为该基因和心脏病风险之间的联系提出测试。"Eichler说:"这是一个明确的例子,说明这些信息将是非常、非常有价值的。