第七节 表观调控

表观遗传学是指研究基因表达或蛋白表达的改变、不涉及DNA序列变化,但又可以通过细胞分裂稳定遗传现象的遗传学分支领域,包括DNA甲基化、组蛋白修饰及染色质重塑等。1942年,Waddington首先提出了“表观遗传学”这一概念,用以定义基因型未发生改变而表型改变的现象,以解释发育的各个方面,阐释了生物体从基因到基因表型之间存在一种控制机制。1987年,Holiday发现表观遗传研究包含有丝分裂和减数分裂在细胞和个体世代间传递,而非DNA序列的改变。1995年,约翰·霍普金斯大学(Johns Hopkins University)医学院的Stephen Baylin发现多种人体肿瘤中抑癌基因周期蛋白依赖性激酶抑制因子2A(cyclin dependent kinase inhibitor 2A,CDKN2A)呈高甲基化,而用去甲基化抑制剂处理,能保持CDKN2基因的活性,提示甲基化能使抑癌基因活性沉默。

结直肠肿瘤的发生发展是一个多因素、多阶段的复杂过程,涉及一系列遗传学和表观遗传学累积的改变。近年来,随着人们对表观遗传学认识的深入,尤其是DNA甲基转移酶抑制物,组蛋白乙酰化抑制剂等在治疗肿瘤患者的成功临床应用,表观遗传学逐渐成为肿瘤研究的热点。

一、DNA甲基化修饰

DNA甲基化是调节基因表达的最普遍的表观遗传修饰之一,由DNA甲基化转移酶催化S-腺苷甲硫氨酸作为甲基供体,在基因的5′-CG-3′二核苷酸的胞嘧啶的第五位碳原子上共价结合一个甲基基团,形成5-甲基胞嘧啶。CpG岛是指CpG序列的密度比平均密度高10~20倍,GC含量大于50%,长度为200~2 000bp的区域。哺乳动物细胞中,CpG二核苷酸在人类基因组中约占10%,包括散CpG和CpG岛。其中,70%~90%的散在CpG呈高甲基化状态,而大部分CpG岛中的CpG呈低甲基化状态。CpG岛主要位于结构基因的启动子和第一外显子区域,60%~70%的基因启动子含有CpG岛。病理状态下,DNA甲基化模式的改变包括DNA高甲基化和DNA低甲基化(图3-7-1)。

图3-7-1 DNA甲基化修饰的表观调控机制

(一)DNA高甲基化和CRC肿瘤

启动子区CpG的高甲基化与癌细胞中的肿瘤抑制基因的转录抑制有关,在结直肠肿瘤中尤其明显,在一些重要的肿瘤抑制基因的启动子区域存在异常的高甲基化(表3-7-1)。

表3-7-1 一些CRC中发生高甲基化的基因

注:MSP.甲基化特异PCR;PCR.聚合酶链反应。

(二)DNA低甲基化和CRC肿瘤

全基因组低甲基化是结直肠肿瘤中最早报道的异常甲基化事件之一,是结直肠肿瘤发生的早期事件。一般来说,三个区域的DNA低甲基化与结直肠肿瘤中原癌基因的激活有关:①启动子区域,该区域的低甲基化会导致基因印记的丢失或原癌基因的直接激活;②远距离调控区域,如增强子;③位于某些重复元件下游的反义启动子。人类基因组含有高达17%的含LINE 1型转座酶结构域1(LINE 1 type transposase domain containing 1)的重复元件,它们在正常生理条件下是沉默的,但如果通过低甲基化激活,便可通过“剪切和粘贴”机制发挥反转录转座子的作用,将自身插入远距离的脆弱位点(不稳定的基因组区域)并导致基因组不稳定。LINE-1的低甲基化与MSI和CIMP负相关,同时也与早发性结直肠肿瘤和预后不良有关,因此LINE-1成为潜在的结直肠肿瘤的重要生物标志物。

二、组蛋白修饰

核小体是由核心组蛋白(histone,H)八聚体(H2A×2、H2B×2、H3×2、H4×2)与缠绕其外周的DNA组成的核心颗粒,以及颗粒之间DNA片段和一个H1构成。每个组蛋白的核心蛋白都具有富含赖氨酸和精氨酸残基的特征性尾部(N端),这些残基经过翻译后修饰,可以通过修饰的组蛋白-DNA相互作用直接影响基因表达,或通过改变特异性结合蛋白的识别位点间接影响基因表达。已有研究发现,组蛋白修饰与正常生理行为和发育过程中的许多细胞过程,以及包括癌症在内的各种疾病的发病机制有关,其中研究最多的主要是组蛋白乙酰化修饰和组蛋白甲基化修饰(图3-7-2)。

图3-7-2 组蛋白乙酰化和甲基化修饰的表观调控机制

(一)组蛋白乙酰化

组蛋白的乙酰化和去乙酰化分别由组蛋白乙酰转移酶和组蛋白脱乙酰酶催化。组蛋白乙酰转移酶催化乙酰基从乙酰辅酶A转移到组蛋白赖氨酸残基的氨基。组蛋白尾部的乙酰化可以中和带正电荷的赖氨酸,削弱尾部和带负电荷的核小体DNA之间的静电相互作用,从而影响染色质的压缩状态,使DNA更加容易转录。与原癌基因相关的组蛋白高度乙酰化,常会激活原癌基因表达;而与肿瘤抑制基因相关的组蛋白的低乙酰化,可使基因沉默。因此,这些组蛋白乙酰化调控酶作为CRC等恶性肿瘤的潜在治疗靶点引起了广泛关注。

(二)组蛋白甲基化

组蛋白甲基化是指甲基以特定的方式添加到组蛋白H3和H4尾部的赖氨酸和精氨酸残基上,并且可以导致基因表达的激活或抑制。组蛋白甲基化和去甲基化由组蛋白甲基转移酶和组蛋白去甲基化酶催化,其过表达或低表达可能会改变整体组蛋白甲基化状态,改变数百种癌基因或肿瘤抑制基因的表达,并最终改变,促进癌症发展或进展。例如,赖氨酸特异性脱甲基酶1是一种组蛋白去甲基化酶(histone demethylase,HDMT),可脱甲基化H3K4me2和H3K9,参与调控CRC细胞增殖和分化。与组蛋白乙酰化相比,组蛋白甲基化不仅可以改变DNA的压缩状态,而且在染色质中产生可以被各种蛋白质识别的对接位点,例如包含转录复合物的蛋白质(如转录起始因子TFIID亚基3,可以激活Wnt/β联蛋白靶基因)。

三、非编码RNA

在正常生理发育和几乎所有疾病的发病机制中,约98%的非蛋白质编码基因组参与了基因表达的调节,这些转录本通常被称为非编码RNA(non-coding RNA,ncRNA),可以在转录后进行剪接,但不能翻译成蛋白质。ncRNA能以组织特异性的方式发挥促肿瘤或抗肿瘤功能,已有研究表明,miRNA与lncRNA在CRC发生过程中发挥重要作用。

(一)miRNA

miRNA通过与其靶mRNA的3′-非翻译区中的互补序列结合而发挥转录后抑制的作用,调控超过60%的蛋白质编码基因的翻译。由于miRNA通常位于基因组内的脆弱位点,它们的表达可能通过各种遗传改变而失调,包括点突变、缺失、扩增或易位。此外,DNA高甲基化和低甲基化也可以改变miRNA的表达。许多研究已经发现了CRC肿瘤组织和相邻的正常组织之间miRNA不同的表达水平。miRNA可以通过抑制肿瘤抑制基因的表达作为致癌miRNA(onco-miRNA)发挥作用,或通过抑制癌基因表达作为肿瘤抑制miRNA(ts-miRNA)发挥作用。

(二)lncRNA

lncRNA通过多种机制发挥转录的正向或负向调节作用,包括:与基因启动子或增强子的相互作用;通过充当染色质修饰蛋白复合物的指导分子来修饰染色质通路;核结构的监管;通过与靶mRNA和调节蛋白复合物直接相互作用来调节mRNA稳定性;作为miRNA海绵,通过lncRNA序列内的多个特异性结合位点凝集miRNA。大多数已知的与CRC相关的lncRNA都高表达,起miRNA海绵的作用。此外,也发现有少数lncRNA可以作为肿瘤抑制因子发挥作用,例如,与肿瘤相邻的正常组织相比,生长抑制特异性基因5(growth arrest-specific transcripts 5,GAS5)在人类CRC组织中低表达,并且低水平的GAS5与肿瘤大小、晚期和较差的总生存期成正相关。lncRNA在许多癌症相关通路中发挥作用,如Wnt、EGFR、TGF-β和P53信号通路,并且可以影响CRC发生、进展和转移的几乎所有病理生理过程。

四、表观调控与CRC检测和治疗

目前结肠镜检查可以检测和移除癌前病变,因此被认为是目前CRC筛查的金标准。然而,结肠镜检查是侵入性的、昂贵的,患者的依从性较低,同时也有出血和穿孔等潜在的并发症。相比之下,粪便隐血试验和粪便免疫化学试验是欧洲和其他西方国家最常用的非侵入性筛查试验,但对于癌前病变来说,其灵敏度和特异度低于结肠镜检查。因此,开发新颖且强大的非侵入性检测方法,对于发现癌前病变和早期CRC非常重要。此外,目前用于CRC分期的肿瘤淋巴转移(TNM)分类系统不足以预测预后,迫切需要发现能够区分复发和死亡可能性高的患者的预后生物标志物,以及可能真正受益于化疗、免疫治疗和/或靶向治疗的患者的预测性生物标志物。表观遗传标记及其调节因子,包括DNA甲基化、组蛋白修饰、miRNA和lncRNA,已显示出作为临床相关生物标记的前景,可用于CRC的诊断、预后和治疗反应预测。

(一)表观遗传改变作为生物标志物

1.DNA甲基化

DNA甲基化生物标志物用于诊断的效果明显,其中一些检测方法已商业化,用于当前的临床实践,甚至已进入临床指南。

血浆中SEPT9基因的甲基化是研究最为广泛的用于CRC诊断的DNA甲基化生物标志物,该基因的编码蛋白Septin9是一种参与肌动蛋白动态调控、细胞骨架重塑、囊泡运输和胞吐作用的GTP结合蛋白。多项研究分析了这种甲基化生物标志物在CRC大型队列中诊断的准确性,其灵敏度和特异度分别为48%~90%和73%~97%。血浆SEPT9基因的甲基化水平商业化为Epi proColo测试(Epigenomics),并于2016年被FDA批准为第一个基于分子血液的CRC筛查检测。然而,Epi proColon测试对于进展期(Ⅲ期~Ⅳ期)CRC患者的诊断准确度在统计学上显著优于早期(Ⅰ期~Ⅱ期)CRC患者。

另一种目前较为成熟的用于CRC诊断的非侵入性生物标志物是编码中间丝蛋白波形蛋白的VIM基因的甲基化,它与微管和肌动蛋白微丝一起构成细胞骨架。在血浆样本中,VIM基因的甲基化的灵敏度和特异度分别高达59%和93%,在晚期疾病阶段灵敏度显著增加;在粪便样本中,VIM基因的甲基化的灵敏度和特异度分别高达81%和95%。鉴于其在粪便样本中诊断准确性可能高于血液样本,该生物标志物也已商业化为ColoSure测试(LabCorp)。

2.组蛋白修饰

组蛋白修饰作为生物标志物吸引力较低的原因包括:①其用作定量分析物相关的技术限制(因为大多数使用的方法,如免疫荧光或染色质免疫沉淀,不允许高通量分析);②对不同癌症缺乏特异性。相较于DNA甲基化,目前对组蛋白修饰作为生物标志物的研究较少,不过也有一些有诊断潜力的标志物。例如,与正常结肠黏膜相比,CRC和腺瘤中H3K9的甲基化水平显著升高,CRC中H3K27H4K12的乙酰化修饰水平显著升高。对于非侵入性生物标记物的探索,有初步数据提示,与健康对照个体相比,在CRC患者中观察到循环核小体中H3K9三甲基化(H3K9me3)和H4K20me3标记水平降低。

3.非编码RNA

miRNA作为候选生物标志物的潜力包括:①体积小、数量有限(相对于蛋白质编码基因);②在各种生物样本(如组织、血液和粪便)中较为稳定性;③常规实验室技术(如微阵列和定量逆转录PCR)几乎可以在所有标本类型中进行鉴定和量化。在过去10年中,研究CRC中miRNA的研究数量呈指数级增长,但只有少数研究是针对大型患者队列、精确定义的患者群体和独立验证队列进行的。尽管如此,已在CRC中鉴定出许多潜在的miRNA生物标志物。例如,miR-21的高表达可能是用于诊断、预后和预测CRC治疗反应的重要的生物标志物,其在血液和粪便中均表现出高灵敏度和特异度。与使用单个miRNA生物标志物相比,两个或多个miRNA组合可能是一种更好的诊断方法。

在过去的几年中,lncRNA作为CRC的生物标志物越来越受到关注。HOX转录反义RNA(HOX transcript antisense RNA,HOTAIR)在CRC发展的早期阶段,在血清和组织中均高表达,并且与TNM分期和患者生存相关。结直肠癌相关转录本1(colon cancer associated transcript 1,CCAT1)在肿瘤组织和血液中的高表达也是CRC发生的早期事件,并且与TNM分期、总生存期和无复发生存期相关。

(二)表观遗传治疗

对癌症表观遗传改变的研究不仅提供了有吸引力的生物标志物候选物,而且还为开发新的抗癌药物(即所谓的表观遗传修饰剂)打开了大门。与不可逆的遗传改变不同,从治疗的角度来看具有挑战性,表观遗传改变基本上是可逆的,使其成为有吸引力的治疗目标。已经开发了越来越多的表观遗传修饰剂,其中一些已获得FDA批准用于治疗各种疾病,但尚未有针对CRC的表观遗传修饰药物。已有的表观遗传修饰药物包括参与DNA甲基化(如DNMT和组蛋白脱乙酰酶)和组蛋白修饰(如去甲基化由组蛋白甲基转移酶和组蛋白去甲基化酶)的酶抑制剂,以及调节miRNA表达的治疗性药物,其中一些已经进入CRC的临床前试验或早期临床试验。

值得注意的是,如果单独使用和在晚期使用表观遗传修饰剂,可能导致表观遗传修饰剂的功效低下。在癌症的早期阶段,基因组改变的负担较低,并且表观遗传改变表现为癌变过程中的早期事件;因此,将表观遗传修饰剂用作癌症早期阶段的辅助治疗可能更有效,同时也可能需要延长治疗时间,因为细胞的重编程需要时间并且在治疗停止后可能不稳定。

五、小结

近年来的科学研究表明,表观遗传学在肿瘤的发生和发展中发挥重要的调控作用。表观遗传学的改变可以作为驱动CRC发生的因素之一,也可以作为参与者调节正常结肠黏膜发展为CRC的恶性进程。与基因遗传突变不同,表观遗传学的改变具有动态性和可逆性,为CRC的预防、诊断、治疗及预后提供广阔的思路。更好地理解表观遗传调控机制,特别是肿瘤特异性的表观遗传改变,将有助于探索它们作为生物标志物的未来临床应用或它们作为CRC治疗靶点的潜力。

(谢珊珊)