利用CRISPR研究基因组“暗物质”的论文
超过98%的人类基因组由非编码基因组成。这些非编码基因被称为基因组的“暗物质”,它们能调控编码基因的表达,从而影响人类健康和疾病进程。自从人类基因组序列被公开发表以来,科学家们努力解析基因中的功能元件,包括非编码调节区——参与转录调节的顺式调节区和非编码RNA(ncRNA)。转录因子在整个基因组中可能有数百至数千个结合位点,因此研究起来非常复杂。目前常用的两种研究转录因子调控基因表达位点的方法是:1,耗时且复杂的增强子研究;2,在非天然状态中克隆增强子或启动子序列,开展并行研究。最近Sanjana等人和Fulco等人的研究都指出,可以利用CRISPR技术在天然状态里研究非编码调控元件的功能。
大规模的生化试验使人们发现了由潜在的、被数百种蛋白靶向结合的调节序列。值得一提的是,识别脱氧核糖核酸酶I超敏感位点(deoxyribonuclease I hypersensitive site, DHS)和大规模染色质免疫沉淀测序(chromatin immunoprecipitation–sequencing, ChIP seq)方法的提出,让科学家们能够全面地解析蛋白与染色质结合的情况。然而,把这些分子和功能调控联系起来非常困难。
由于使用不同的CRISPR载体可以无偏向性地敲除蛋白编码基因,因此CRISPR筛选是研究非编码基因功能的有力工具。与人类细胞中NGG(前间区序列邻近基序)序列上游的基因序列同源的单引导RNA(single guide RNA, sgRNA)可以引导CRISPR系统到达特定基因组位点,从而特异性地引起突变。首个CRISPR“敲除”筛选研究在基因组规模上诱导了全基因敲除,并克服了RNA干扰筛选中的诸多限制,例如脱靶效应和敲除不完全(图:CRISPR-Cas9筛选方法)。
Sanjana等人使用CRISPR工具来研究黑色素瘤细胞中调控vemurafenib(B-Raf蛋白V600E突变中,600位点的缬氨酸被谷氨酸所替代,而Vemurafenib抑制携带了V600E突变的B-Raf蛋白中的丝氨酸 – 苏氨酸蛋白激酶结构域)抗性的序列。研究人员使用CRISPR工具靶向主要的抗性调节区域——NF1(neurofibromatosis type 1,神经纤维瘤病1型基因)、NF2(neurofibromatosis type 2,神经纤维瘤病2型基因)和CUL3(cullin 3,泛素连接酶3)。该方法中,向导RNA和反式激活crRNA(trans-activating crRNA)融合,引导来源于酿脓链球菌的Cas9(spCas9)在目标位点处诱导DNA双链断裂,从而产生突变。结果显示,靶向CUL3的sgRNA在转录起始点最为富集。sgRNA富集的区域,CUL3被敲除,这表明,CUL3似乎与染色体相互作用、组蛋白翻译后修饰,以及转录因子结合位点阻断的调控区域相关。
Fulco等人利用CRISPR干扰系统,即利用失活的Cas9和KRAB蛋白融合,沉默靶向序列的表达。这种方法虽然实现了靶向性的基因沉默,但并未引起基因突变。研究者们设计的靶向序列围绕在MYC和GATA1基因附近(这两个基因能调控K562红白血病细胞的增殖)。他们首先使用病毒感染细胞,将CRISPRi系统载带进入细胞,然后使用多西环素诱导dCas9靶向目标序列。他们发现,sgRNA富集点恰好和包含多个转录因子结合位点的DHS重合。更有趣的是,dCas9靶向GATA1或组蛋白脱乙酰酶6(HDAC6)增强子时,都会减少HDAC6表达。这表明,对于共同的增强子(GATA1和HDAC6存在共同的增强子),基因之间存在竞争关系。鉴定出来的MYC增强子的位置与转录起始位点、CCCTC-结合因子(CTCF,介导染色质相互作用)结合位点都是吻合的。这可能是MYC调控细胞增殖的机制。
虽然CRISPR-spCas9和CRISPRi筛选方法都成功识别了非编码调节元件,但CRISPRi只能用于转录抑制,鉴于不同基因之间的转录抑制是不同的,CRISPR不一定能适用于其它基因的转录抑制。但总的来说,这两项研究都证明了CRISPR在研究非编码调控网络上的潜力。此外,研究已经证实,虽然非编码基因的突变只能造成微小的基因表达变化,但可以造成大的表型变化,这意味着CRISPR筛选也可以推广到其它疾病的表型测定上。尽管全基因组关联研究已经鉴定出致病的生殖细胞突变,但是系统性研究致病的体细胞突变中的非编码调控元件突变也具有重要意义。例如,研究表明,一些疾病的发病原因是特定转录因子结合位点增加的突变、基因重组造成的融合事件、ncRNA造成的突变,以及伪基因。对这些非编码调控元件的研究能加深我们对疾病发生、发展的理解,从而促进临床手段的研发。
本文标签:
[!--temp.ykpl--]