2003年研究人员完成了人类基因组计划项目,共对人类基因组中所有30亿个碱基对进行了测序,很多人认为我们机体的DNA是一本开放的百科全书,但一个令人困惑的问题很快也会出现,尽管科学家们对这本书进行了翻译,但仅仅只是解释了其中很少一部分内容。
机体中有高达98%的DNA并不会编码产生蛋白质,很多基因组暗物质被认为是一些非功能的进化残留物,然而在这些非编码DNA中隐藏了很多至关重要的调节性原件,其能够控制数千个基因的活性,此外,这些原件在多种疾病发生中也扮演着非常关键的角色,比如癌症、心脏病、自闭症等,同时这些原件也能为科学家们开发新型疗法提供新的线索。
为了绘制图谱并且解释人类基因组中功能性序列的功能,2月2日美国国立卫生研究院发布了一项资金用于资助5个有特色的研究中心,其中就包括旧金山的两个研究中心,旨在研究这些调节性原件如何影响基因表达乃至影响基因的行为。这项研究计划中,研究人员将会利用#!新的研究技术,比如基因编辑技术来深入探究人类生物学的本质,从而有望未来帮助开发出治疗复杂遗传性疾病的新型疗法。
基因组入门的重要性
当人类基因组计划表现出明显的不足时,2003年9月美国国家基因组研究所(National Human Genome Research Institute)发起了一项名为ENCODE的研究计划(DNA原件百科全书研究计划),这项计划的目的就是寻找人类基因组中所有的功能性区域,以及这些区域是否会形成基因。研究者Elise Feingold说道,人类基因组计划绘制出了人类基因组中的元件信息,但其并未告诉我们一些“语法”信息,比如标点在哪里,从哪里开始,又从哪里结束,这就是ENCODE计划未来所要研究的。
研究者支出,我们发现了数百万个非编码的字母序列能够发挥必要的调节性功能,就好像在不同类型的细胞中开启或关闭基因的表达,然而,如今研究者们已经证实这些调节性的序列具有重要的功能,但其并不知道每一个序列所发挥的功能,或者是哪些基因会受到影响,这是因为这些序列通常距离其靶向基因的距离较远,此外,在不同类型的细胞中还有很多序列发挥着不同的效应。
美国国家基因组研究所发起的这项研究计划能够使得5个研究中心对这些调节性序列的功能以及基因靶点进行准确研究,这5个研究中心分别是两个位于加州大学的研究中心(研究者Nadav Ahituv和Yin Shen博士),其它三个分别位于斯坦福大学、康奈尔大学以及劳伦斯伯克利国家实验室,此外这些研究中心还将会继续关注图谱的绘制、计算机分析、数据分析以及数据的协调工作。
细胞条形码揭示调节性功能
新技术的使用能够更加容易地帮助研究人员鉴别出调节性序列的功能和靶点,如今科学家们也能够更好地操控细胞来获取关于DNA的更多信息,在高通量筛选技术的帮助下,研究人员就可以大批量地进行研究,在一项实验中对数千个序列进行检测。研究者Ahituv教授表示,通常我们很难对基因组中的一些非编码部分的功能进行检测,对于一个基因而言,我们很容易评估其效应,因为基因编码的相关蛋白也会发生改变,但对于调节性序列而言,你并不知道DNA的改变会发生什么,因此我们往往很难预测其功能性的结果输出。
研究者Ahituv和Shen都能够利用创新性的技术来对增强子序列进行研究,增强子在基因表达过程中扮演着重要的角色,机体中每个细胞都包含着相同的DNA,确定一个细胞是皮肤细胞或脑细胞亦或者是心脏细胞主要看其基因的表达和关闭情况,增强子就是其中的秘密开关,其能够开启细胞类型的特殊基因的表达。
剔除序列来研究其所扮演的角色
研究者Shen能够采用一种不同的方法来对调节性序列的功能进行特性分析,在同研究者Bing Ren进行合作研究后,她开发出了一种高通量的CRISPR-Cas9的筛选方法来检测非编码序列的功能,如今两位研究者开始利用这种方法鉴别具有调节性功能的序列以及其寻找其所影响的基因。Shen将会利用CRISPR对大量细胞中成千上万个调节性原件进行编辑,并且追踪对60对基因进行编辑后引发的效应。
这项研究工作中,每个细胞都会被编程来反映两种荧光颜色(每一个对应一种基因),如果细胞中的光熄灭了,科学家们就知道其中一种基于CRISPR的序列编辑所影响的靶基因了,最后一步就是对每个细胞中的DNA进行测序来确定基因表达改变所诱发的调节性序列的编辑。通过监测共表达基因的颜色,研究者Shen就能够阐明多个功能性序列和多个基因之间的复杂关联,而这远远高于传统测序技术的搜寻范围。Shen说道,直到最近CRISPR技术被开发,此前我们并不可能大规模对非编码序列进行遗传化操作,如今对CRISPR技术进行放大后我们就能够在一项实验中对数千个调节性序列进行筛选,这种方法不仅能够告诉我们细胞中的哪些序列能够发挥作用,而且还能够帮助发现这些序列所调节的靶向基因。
利用暗物质DNA能够治疗疾病吗?
通过对数千个调节性序列的功能进行分类,研究者Shen和Ahituv希望能够制定出新规则来揭示如何预测以及干扰其他序列功能的机制,这不仅能够帮助阐明基因组暗物质的角色,还能够为开发治疗复杂遗传性疾病的新型疗法提供治疗靶点。Ahituv说道,目前我们发现很多疾病都和调节性序列直接相关,比如对常见疾病(糖尿病、癌症以及自闭症)进行全基因组关联性研究中研究者就发现,90%的疾病相关的DNA突变都位于非编码的DNA中,因此并这不是一个发生了改变的基因,而是调节该基因的区域。
随着对人类基因组测序的价格明显下降,目前很多人都在讨论利用精准化疗法来治疗多种严重的人类疾病,然而如何解释非编码DNA中的这些突变对研究者而言仍然非常困难。最后研究者Shen表示,如果我们能够对这些调节性序列的靶基因进行鉴别以及特性研究,那么我们就能够开始阐明这些调节性序列突变后诱发疾病的分子机制了,最终我们或许就能够通过纠正这些调节性序列的突变来治疗复杂的人类疾病了。
会议合作、活动报道需求可联系彭先生:18820041981(微信同号)。