- 结直肠肿瘤学
- 王锡山 顾晋 丁克峰主编
- 12821字
- 2025-03-15 00:43:23
第二节 结直肠癌的分子流行病学
结直肠癌是指穿透黏膜肌层,浸润到黏膜下层的结肠或直肠上皮来源的肿瘤。2020年全球癌症统计报告显示,结直肠癌发病率和死亡率位居全球肿瘤第3位,已成为严重影响人类健康的恶性肿瘤之一。目前,我国结直肠癌的发病率也位于第3位,结直肠癌的防治工作迫在眉睫。
结直肠癌的发生是一个多步骤及多阶段的发展过程,是外部环境因素和机体内部遗传因素相互作用的结果。基因组、表观遗传组、蛋白质组和代谢组等组学技术的迅速发展,给结直肠癌的分子流行病学提供了前所未有的机遇。目前,结直肠癌的分子流行病学研究主要围绕遗传因素、环境因素以及两者间的交互作用展开,其主要研究方向是寻找具有高灵敏度和特异度,可用于早期诊断、评估疗效和预后判断的生物标志物,以达到开展早期预防、筛检、诊断及个体化干预和治疗的目的,从而降低结直肠癌的发病率及死亡率,最终改善结直肠癌患者的预后及生存质量。
一、结直肠癌分子流行病学的概念
结直肠癌分子流行病学是指应用分子生物学检测技术,结合现场流行病学研究方法,从分子或基因水平阐明结直肠癌的病因及其致病过程,探讨结直肠癌生物标志物在人群中的分布特点和影响因素,对机体致癌物质暴露、生物学效应以及个体遗传易感性进行测量和评价,筛选对特定致癌因子敏感的个体和亚群,阐明结直肠癌发生及发展的机制,并研究结直肠癌防治和促进健康的策略和措施。
结直肠癌分子流行病学的研究内容主要包括:环境致癌物暴露的检测及评价,遗传易感性研究,环境与基因交互作用,肿瘤诊断、治疗及预后生物标志物研究等。其中,最重要的研究内容是生物标志物,包括暴露生物标志物、效应生物标志物和易感生物标志物等。
传统的流行病学是从病因或者危险因素的暴露出发,研究肿瘤发生或死亡的结局,但是缺乏暴露与肿瘤之间的系列过程或事件研究。此外,评估个体罹患肿瘤风险具有重要的公共卫生意义,对于结直肠癌的筛查、干预和治疗起到关键作用。目前结直肠癌的分子流行病学研究主要应用在以下方面。
1.结直肠癌发生发展的环境暴露因素及其作用机制
将流行病学方法与分子生物学技术相结合,选择多种生物标志,在基因及分子水平阐述肿瘤发生机制,为确定暴露与肿瘤之间的因果关系提供更可靠的证据。例如,传统的流行病学已经证实吸烟与结直肠癌的发生及发展密切相关,但香烟烟雾暴露引起结直肠癌发生的具体机制并不明确。分子流行病学通过多种生物标志物检测,研究烟草暴露后在人体中具有致癌作用的化学成分,包括多环芳烃、杂环胺、亚硝胺等致癌物质通过血液循环到达结肠黏膜系统或直接摄入,引起肠道细胞和组织中发生基因突变等一系列致癌过程,从而阐明吸烟致结直肠癌的内在机制。
2.评估个体易感性并进行高危人群筛查
暴露在相同环境中的个体仅有一部分人发展为肿瘤,提示环境因素对结直肠癌的发生和发展发挥关键作用,但是遗传因素对结直肠癌的发生也起着重要作用。双生子研究表明,约有40%的结直肠癌发病取决于遗传因素。家系研究也发现,相对于无肿瘤家族史的个体,一级亲属患有结直肠癌的个体罹患结直肠癌的风险增加1~2倍。随着遗传易感基因研究的深入,传统的个体结直肠癌风险评估在灵敏度和特异度方面得到进一步提高。同时随着分子标志物的发展,在以人群为基础的流行病学研究的基础上,可以整合更多与结直肠癌发病机制和易感机制有关的生物标志物,从而进一步提高结直肠癌高危人群鉴别及危险度评估的能力。
3.建立科学合理和高效便捷的预防策略
结直肠癌的预防与控制是以人群为主要对象,从病因学角度严格控制致癌危险因素暴露,或在肿瘤发展的早期阶段进行检测、诊断及治疗。即使晚期结直肠癌患者,也可以通过减轻疼痛、减缓肿瘤的进展、社会支持等手段,提高患者生存率,降低疾病负担。通过分子流行病学研究,研究结直肠癌发生及发展的生物标志物及其作用机制,进一步结合三级预防的公共卫生策略,增强肿瘤防控的科学性,提高肿瘤防控效率,建立合理且有效的预防策略,针对性地采取一系列预防措施。
4.建立临床和药物干预评价
结直肠癌分子流行病学研究发现的肿瘤治疗和预后标志物,从细胞水平上抑制癌生长或促进凋亡,可作为结直肠癌靶向治疗药物的作用靶点。然而,由于结直肠癌发病的异质性和复杂性,目前仍缺乏非常理想的生物标志物能够快速并准确地用于结直肠癌检测和疗效预测。因此发现和优化结直肠癌临床干预的生物标志物还需要进一步探索。
二、结直肠癌发生发展的分子机制
90%的结直肠癌是从结直肠腺瘤性息肉逐渐演化而来,从良性的腺瘤性息肉演变为癌,一般需要5~10年,在息肉阶段发现并切除息肉,是预防结直肠癌的有效途径(图1-2-1)。结直肠癌的癌变过程是遗传和表观遗传异常,以及一系列修复作用相结合的逐步积累的过程。该多阶段演变的过程包括:癌前病变(结直肠腺瘤)的发生及其向肿瘤进展相关的基因变化、缺陷DNA修复、染色体不稳定、微卫星不稳定性(microsatellite instability,MSI)、锯齿状肿瘤通路改变和DNA甲基化改变等。其中,基因组不稳定性、抑癌基因失活、癌基因激活是结直肠癌发生的重要启动因素。

图1-2-1 结直肠癌变“息肉-腺瘤-肠癌”的进展过程
(一)结直肠腺瘤癌变的序贯学说
大多数结直肠肿瘤起源于息肉,主要分为传统的管状腺瘤或锯齿状息肉。位于肠隐窝底部的干细胞不断增殖产生祖细胞,向上移行分化成为具有特定功能的终末分化细胞。一旦打破维持增殖与分化的内在平衡机制,肠上皮的完整性将会因此改变,进而造成上皮屏障功能紊乱。该进程中,调节DNA修复失败和细胞增殖异常可引起腺瘤发生,随着突变细胞向结肠腔推进,打乱了典型的可预测的终末分化和凋亡过程,腺瘤性息肉不断增大,表现出不良进化特征,最终侵袭下层黏膜细胞,形成恶性肿瘤。
关键生长调节基因的异常提示正常上皮向增殖转变,将特定的基因改变和组织学的进展特征结合起来,已经成为实体肿瘤发生发展的一个范例。抑癌基因APC和癌基因BRAF发生突变是导致传统腺瘤及锯齿状息肉的起始事件。基因突变的发生标志着从早期到中期肿瘤的进展,其次是具有高度发育不良的晚期息肉,最后是侵袭性肿瘤。然而,并不是所有腺瘤都可以发展成为肿瘤,特定顺序的突变积累对于发展为恶性结直肠癌十分重要,其发生的时间取决于肿瘤发生的特定途径。
(二)染色体不稳定性
染色体不稳定性发生在65%~70%的散发性结直肠癌组织中,包括获得、缺失、插入、易位、重排或杂合性丢失等染色体异常事件,引起体细胞拷贝数异常。因为编码序列中的碱基对突变相对缺乏,所有通过该途径发展的肿瘤通常认为是非高突变型。导致染色体不稳定的机制常表现为染色体分离缺陷,例如:控制姐妹染色单体分离机制、由端粒缩短引起的细胞衰老紊乱,最终导致基因组重组、功能失调的DNA损伤反应机制,以及抑癌基因的杂合性缺失等。这些核型异常经常伴随抑癌基因APC和TP53突变,以及癌基因KRAS和PIK3CA激活突变事件。
APC突变是结直肠癌发生中最早的遗传事件,约80%的肿瘤组织存在该突变事件。APC的常染色体显性突变导致家族性腺瘤性息肉病,表现为数百或数千个腺瘤性息肉。APC是一个抑癌基因,其活性丧失可以激活Wnt信号通路,进而激活包括MYC、CCND1、VEGF等下游基因。受Wnt通路调控的AXIN1、AXIN2和CTNNB1等基因发生突变,也可以在没有APC突变的情况下扩增Wnt通路活性。该信号通路是肠上皮细胞增殖的重要调控因子,参与结直肠癌的发生发展,在几乎所有的染色体不稳定性肿瘤中都处于激活状态。
KRAS突变通常发生在APC突变后,并在近40%的结直肠癌中发现。KRAS是多个生长因子信号通路的组成部分,包括表皮生长因子受体(epidermal growth factor receptor,EGFR)通路。在该通路中,KRAS激活引起Raf-MEK-ERK、PI3K、MTOR和NF-κB等通路的结构性激活。Raf家族中的蛋白质是丝氨酸/苏氨酸激酶,它们可以激活MEK1和MEK2,导致ERK1和ERK2蛋白磷酸化,促进细胞周期进程相关酶磷酸化。该通路在结直肠癌等许多肿瘤中被激活,特别在转移性结直肠癌中可能作为药物治疗靶标。
此外,KRAS突变结直肠癌组织同时发生PI3K突变。PI3K是一种异二聚体脂质激酶,可磷酸化一种细胞信号分子磷脂酰肌醇。活性增强的PI3K可增加前列腺素的合成,进而抑制结直肠癌细胞凋亡。PIK3CA的激活突变出现在腺癌晚期,并在10%~20%的结直肠癌中发现,也可发生在乳腺、脑、卵巢、肝和肺等肿瘤中。PIK3CA的功能获得性突变通过MTOR激活AKT信号,促进细胞增殖,抑制细胞凋亡。
TP53基因是位于人类17号染色体短臂的抑癌基因,在肿瘤中最容易发生基因突变。其产物P53蛋白调节DNA修复和细胞对氧化应激反应基因的转录。TP53突变致P53功能缺失在结直肠癌中最为常见,其次是浸润性腺瘤和良性腺瘤。TP53突变频率与临床分期存在关联,TP53突变也与肿瘤恶性进展相关。约60%的染色体不稳定性瘤体中含有TP53失活突变。携带TP53胚系突变的利-弗劳梅尼综合征患者,发生结直肠癌的风险显著升高。此外,TP53胚系突变携带者罹患早发结直肠癌较高(诊断年龄<50岁的患者)。
此外,在超过70%的结直肠癌(仅在晚期)中发现了位于18号染色体长臂的杂合性丢失。这一观察结果表明在该区域存在结直肠癌抑制基因,候选基因包括DCC和编码转化生长因子TGF-β通路SMAD2和SMAD4基因等,这些基因功能紊乱可能导致细胞过度增殖,促进结直肠腺瘤向高级别瘤转变或癌变。
(三)微卫星不稳定性
1993年,微卫星不稳定性(microsatellite instability,MSI)作为结直肠癌中常见的分子事件被首次报道。MSI指与正常组织相比,肿瘤中某个微卫星位点由于重复单元的插入或缺失而出现新的微卫星等位基因的现象。MSI的发生是由于肿瘤组织的DNA错配修复(mismatch repair,MMR)出现功能性缺陷导致。伴随着MMR缺陷的MSI现象是临床中一项重要的肿瘤标志物。一般来说,MMR基因(MLH1、MSH2、MSH6、PMS2)或EPCAM(编码一种调节MSH2的蛋白质)的突变会导致微卫星区域内不稳定。MSI在近15%的散发性结直肠癌和几乎所有林奇综合征型结直肠癌(遗传性非息肉性结直肠癌,是一种家族性遗传性疾病)中存在。然而,大多数伴有MSI的结直肠癌是散发性的。MSI表型最常见的原因是通过启动子高甲基化导致MLH1基因的表观遗传沉默。具有MSI的结直肠癌通常在整个基因组的调控区域有高水平的甲基化,包括CpG岛甲基化表型(CIMP)。美国国家癌症研究所(National Cancer Institute,NCI)首次推荐了MSI检测的五位点评价系统,包含两个单核苷酸重复位点BAT-25和BAT-26,以及三个双碱基重复位点D2S123、D17S250、D5S345,后来被称为Bethesda Panel(或称NCI Panel)。目前临床上检测癌细胞微卫星不稳定,既可以通过检测MMR蛋白缺失来确定是否发生MSI,如依赖于免疫组化技术的蛋白水平检测,也可以直接检测MSI标志物的序列长度变化,如多重荧光PCR-毛细管电泳技术和第二代测序技术。
(四)锯齿状肿瘤途径
目前结直肠癌有两种主要的癌前病变途径:传统的腺瘤-癌途径导致70%~90%的结直肠癌,锯齿状肿瘤途径导致10%~20%的结直肠癌。这些途径代表了不同的多重遗传和表观遗传事件。传统的腺瘤-癌途径主要与染色体不稳定表型相关,通常是在APC突变引发的基因组事件之后发生,随后是RAS的激活或TP53的功能丧失。相反,锯齿状肿瘤途径与RAS和RAF突变及表观遗传不稳定性相关,以CIMP为特征,导致微卫星稳定和不稳定的结直肠癌。锯齿状息肉是一群异质病变,其特点是星状的隐窝折叠,包括良性增生型息肉、癌前无柄锯齿状腺瘤或息肉,或传统的锯齿状腺瘤。
锯齿状肿瘤通路是结直肠癌发生的独特机制,具有MSI的锯齿状肿瘤与从癌前病变向癌的进展相关。这种途径的显著特征是激活BRAF V600E突变,发生在锯齿状肿瘤通路的早期,导致丝裂原活化蛋白激酶-ERK通路的结构性激活和不受控制的细胞分裂。BRAF在大多数无柄锯齿状腺瘤中发生突变,但在传统腺瘤中很少发生突变,支持了锯齿状途径是结直肠癌发生独特途径。
BRAF突变后,锯齿状瘤通过两种不同的途径进展为结直肠癌。一种途径与MSI类似,MMR基因突变导致高MSI表型,这些肿瘤通常由无柄锯齿状腺瘤发展而来。另一种BRAF突变的肿瘤可以获得TP53突变并激活多种致癌途径,包括Wnt信号、TGFB信号和上皮-间充质转换;这些不会导致高MSI,而是微卫星稳定肿瘤。这种肿瘤通常通过传统的锯齿状腺瘤作为中间病变发展,具有间充质亚型肿瘤的特征,包括EMT上调、TGF-β激活、间质浸润等。与高MSI表型的肿瘤不同,间充质亚型肿瘤表现出缺乏免疫细胞、低PD-L1表达、整体DNA甲基化降低和抗原提呈基因转录抑制的特点。该特点有助于肿瘤逃避免疫应答,从而导致结直肠癌患者生存率降低。
虽然BRAF突变是锯齿状通路中首先被检测到的分子事件,但Wnt通路的激活也并不少见。在这种情况下,Wnt通路不是被APC突变激活,而是由错义APC突变或RNF43突变的替代途径激活。RNF43是一种E3泛素连接酶,可以通过Rspo(R-Spondin)抑制Wnt信号,高达85%的MLH1甲基化的高MSI肿瘤有RNF43突变。
值得注意的是,由锯齿状肿瘤途径的任何一部分发展而来的肿瘤通常也表现出高甲基化CIMP。CpG岛是胞嘧啶/鸟嘌呤(CpG)二核苷酸的密集簇,由一个磷酸二酯键连接,特别富集在基因启动子区域。启动子区域的高甲基化,特别是来自抑癌基因上游的启动子区域,会使基因转录抑制,导致基因沉默并最终形成肿瘤。高甲基化CIMP有一个重要作用机制,即依赖于其转录抑制因子MAFG可以招募BACH1、CHD8和DNMT3B,使MLH1在内的关键基因启动子高甲基化,并且BRAF突变上调了MAFG的水平,以增强其与启动子的结合。高甲基化CIMP在约20%的结直肠癌中出现,且通常同时存在BRAF突变和MLH1高甲基化,最早可在肿瘤发生早期观察到,例如,与无柄锯齿状腺瘤、传统的锯齿状腺瘤和其他更晚期的病变相比,微泡型增生性息肉呈现高甲基化CIMP状态。
三、结直肠癌生物标志物
生物标志物是指外源性物质通过生物学屏障并进入组织或体液后,机体对外源化学物或其生物学过程的客观测量和评价指标,同时也是生物体受损时的重要毒作用指标。随着分子生物学技术的发展,分子生物标志物在早期诊断、个性化治疗及预后评价等领域具有潜在应用价值,已成为个体化医学和精准医学的一个重要组成部分。
肿瘤分子流行病学采用传统流行病学研究方法,结合分子生物学等新兴学科的理论和技术平台,通过对有代表性人群从接触危险因素、癌前病变发展到肿瘤形成过程中一系列肿瘤标志物的研究,可以准确地测量暴露、生物学效应和遗传易感性,并研究肿瘤发生的生物学机制。肿瘤标志物作为连接实验室检测和人群流行病学研究的桥梁,在癌前病变或肿瘤中发生生物学改变的分子或过程,既可由肿瘤细胞或周围的正常组织产生,又可以是机体对肿瘤刺激的反应性产物。通过对研究对象的定性或定量检测,可以评估致癌物暴露和机体遗传易感性的单独或联合作用,促进了肿瘤病因学研究,也可以作为临床上评价预后和治疗反应的标志来替代临床试验的真正终点,达到解析病程、评价疗效及复发、判断预后,从而辅助临床治疗的目的。在结直肠癌分子流行病学中,生物标志物的研究主要应用于暴露评估、易感性判定、疾病筛检与诊断及发病机制研究等。
表1-2-1比较了目前结直肠癌筛查的主要方法和工具及其检测效果,包括粪便隐血试验、内镜检查、影像学等。生物技术的进步也提供了一系列无创性方法来检测各种体液中潜在的DNA、RNA或蛋白质疾病标志物。愈创木脂粪便隐血试验(gFOBT)简单、低成本,粪便免疫化学检测(fecal immunochemical test,FIT)能够特异地识别粪便中下消化道的人血红蛋白。由于在不降低特异度的情况下增加了灵敏度,粪便免疫化学检测已经在很大程度上取代了愈创木脂粪便隐血试验。结直肠镜检查是早期诊断结直肠癌和结直肠腺瘤最有效的手段之一,可以早期发现和治疗结直肠癌前病变及早期肿瘤。CT结肠成像对于10mm以上的病变具有很高的灵敏度和特异度,该检查不需要恢复时间,受检者能够耐受该检查,并在检查后可立即恢复正常活动。多靶点粪便DNA检测(MT-sDNA)是一种非侵入性方法,能够识别粪便样本中DNA的变化。粪便DNA检测是一种筛查结肠癌的新方法,如果呈现阳性,可以进一步进行结直肠镜检查。
表1-2-1 结直肠癌筛查方法的比较

注:gFOBT.愈创木脂粪便隐血试验;FIT.粪便免疫化学检测;mRNA 7 gene panel包括ANXA3、CLEC4D、LMNB1、PRRG4、TNFAIP6、VNN1和IL2RB;miRNA 4 gene panel包括miR-193a-5p、miR-210、miR-513a-5p和miR-628-3p。
(一)暴露生物标志物
暴露生物标志物是对各种组织、体液或排泄物中存在的化学物质及其代谢产物,或它们与内源性物质作用的反应产物,可提供有关外源化学物的暴露信息。暴露生物标志物一般依靠测定体液和组织中特定化学物质或其代谢物,或者与生物分子相互作用形成。暴露生物标志物可分为内剂量标志物和生物效应剂量标志物。前者指示生物机体暴露的发生和程度,后者指示靶分子、结构和细胞受暴露程度。
1.内剂量标志物
尽管生物暴露于化学物质的水平可以通过外环境监测结果来估算,但毒物吸收、分布和排泄具有较强的个体异质性。因此,通过测定体液或组织中特定化学物质或其代谢物的浓度,可明确机体暴露于特定化学物质的浓度和水平。在测定特定化学实际暴露时,以测定其代谢物为佳。例如,谷胱甘肽具有对暴露活性物质的解毒作用,谷胱甘肽共轭作用所形成的代谢物可作为潜在暴露标志物,如谷胱甘肽共轭的最终产物、各种巯基尿酸是较好的体内剂量生物标志物。在结直肠癌中研究较多的暴露标志物有钙、维生素D、血脂、叶酸、有机氯化合物、金属元素及胰岛素相关分子等。
(1)钙:
钙元素的抗肿瘤假说,主要是离子钙可在结肠腔内与促进肿瘤的游离脂肪酸和胆汁酸形成不溶性盐。一项经过近20年随访评估的前瞻性队列研究发现,钙摄入量最高组(后25%)与最低组(前25%)相比,结直肠癌的风险降低了约70%。随机对照试验研究发现,钙补剂使用可以显著减少腺瘤复发,特别是组织学上的晚期病变。细胞外钙可能通过抑制细胞增殖、促进细胞分化和凋亡、抑制氧化、DNA损伤和修复及结直肠癌相关细胞信号通路介导结直肠癌发生,这些作用可能与细胞外钙感应受体信号通路有助于维持肠道屏障功能的完整性相关。一项自然人群队列研究发现,每天钙摄入量700~1 000mg可以有效降低结直肠癌风险,在此基础上补充钙并不会进一步显著降低结直肠癌风险。此外,钙可能由于其他饮食因素或遗传背景的不同而对结直肠癌发生风险产生不同的影响。
(2)维生素D:
1980年,首次提出维生素D水平是太阳紫外线辐射低暴露人群结直肠癌高死亡率的原因。提高维生素D水平有利于降低结直肠癌的发病率,且血浆维生素D水平与结直肠癌的发生和死亡成显著负相关。2017年一项研究显示,25羟基维生素D[25(OH)D,是维生素D在体内的主要存在形式]水平高的人群比对照人群罹患结直肠癌风险降低了62%。另一项亚洲人群的研究结果也与上述一致,最高(后25%)比最低(前25%)维生素D人群发生结直肠癌的风险降低了79%,但亚洲人群维生素D缺乏的发病率较西方人群更高。此外,也有研究将结直肠癌的肿瘤标志物糖类抗原19-9(CA19-9)、癌胚抗原(CEA)与血清25(OH)D联合检测作为临床诊断标志物,结果提示联合诊断对结直肠癌早期诊断和评估患者病情进展具有重要的临床价值。
(3)血脂:
近年来有研究指出,结直肠癌患者大都伴有较严重的血脂异常情况,并且异常的血脂水平变化也成为了结直肠癌发生发展的重要危险因素。血脂的相关生物学指标包括甘油三酯、总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇等。有研究发现,结直肠癌患者血脂水平明显下降,且与结直肠癌预后密切相关,联合血脂指标与血清肿瘤标志物CA19-9、CEA、CA125诊断结直肠癌,更有助于提高诊断准确性。
2.生物效应剂量标志
生物效应剂量标志是指外源性化学物进入机体后,能与某些靶细胞或靶分子相互作用的产物,它相对于内剂量标志有更精确的生物学意义。肿瘤是DNA损伤后修复失败或修复出错的结果,无论致癌物是外源性还是内源性,这都是致癌物发挥作用的关键步骤。机体暴露于化学致癌物的有效剂量通常是通过测定组织或体液中特定的DNA加合物来确定。结直肠腺瘤的病例和对照研究发现,多环芳烃诱导DNA损伤,结直肠腺瘤病例的白细胞PAH-DNA加合物高于无息肉对照组,可以验证PAH-DNA加合物作为结直肠腺瘤风险的生物标志物。奥沙利铂作为主要的结直肠癌治疗药物,其通过形成链内二核苷酸DNA加合物来诱导肿瘤细胞死亡,但大约一半的肿瘤患者会产生耐药性,这种耐药性是由DNA修复水平的变化或净药物流入介导的。已有研究通过分析七种奥沙利铂敏感和三种奥沙利铂耐药的结直肠癌细胞系的DNA损伤和修复效率,更好地定义了核苷酸切除修复和DNA损伤在铂化疗耐药中的作用,DNA加合物可作为奥沙利铂的早期敏感标志,评估结直肠癌化疗效果。
(二)效应生物标志物
效应生物标志是指在一定的环境暴露物的作用下,能够反映外源性物质及其代谢产物早期的生化、生理或其他病理方面改变的效应指标,即指示环境暴露物质对生物体健康状况的损害效应。表观遗传标志和调节因子,包括DNA甲基化、循环肿瘤DNA(circulating tumor DNA,ctDNA)、非编码RNA(non-coding RNA,ncRNA)[指不编码蛋白质的RNA,包括长链非编码RNA(long noncoding RNA,lncRNA)、微RNA(microRNA,miRNA)、环状RNA(circular RNA,circRNA)、Piwi相互作用RNA(Piwi-interacting RNA,piRNA)等]和组蛋白修饰等,已显示出作为结直肠癌诊断、预后和预测治疗反应的临床相关生物标志物的应用潜力。
1.DNA甲基化
DNA甲基化是调节基因表达的最普遍的表观遗传修饰之一,通过DNA甲基转移酶DNMT在胞嘧啶环的C5位置添加甲基CH3,产生5-甲基胞嘧啶。血浆中SEPT9基因甲基化是用于结直肠癌诊断最广泛的非侵入性DNA甲基化生物标志物之一,该基因编码一种GTP结合蛋白,参与肌动蛋白动力学、细胞骨架重塑、囊泡运输和胞吐作用。该标志物于2016年获得美国食品药品监督管理局(Food and Drug Administration,FDA)批准,并且是第一个基于血液表观遗传学改变筛查肿瘤的方法,中国也已有多家公司的SEPT9甲基化检测试剂盒获得国家药品监督管理局批准。多项大型队列研究分析了SEPT9甲基化生物标志物在结直肠癌的诊断准确度,其灵敏度为48%~96%,特异度为79%~99%。此外,研究者也尝试采用多个基因甲基化联合检测的方法以进一步提高诊断效能。例如在一项2 127例研究对象的多中心横断面研究中,血浆BCAT1/IKZF1双基因甲基化诊断结直肠癌的灵敏度为66%,特异度为95%。
2.循环肿瘤DNA
循环游离DNA(circulating free DNA,cfDNA)主要来自正常健康的白细胞和基质细胞,但在肿瘤患者中,cfDNA也可以合并肿瘤来源的DNA,称为循环肿瘤DNA,是一种新兴的生物标志物。一般来说,ctDNA来源于在细胞死亡过程释放到血液循环中的体细胞DNA片段,并被发现含有肿瘤特异性的分子特征。据估计,肿瘤患者的ctDNA通常占总cfDNA的0.01%~5%。在最近的一项前瞻性及多中心队列研究中,研究者分析了Ⅰ~Ⅱ期结直肠癌患者的血浆ctDNA,发现在122例患者中,108例(88.5%)可检测到ctDNA。此外,还发现检测出ctDNA的患者复发的可能性是未检出患者的7倍。同样,ctDNA检出的患者在辅助化疗后也可能复发,且经常规治疗,ctDNA检出的患者后续随访期间复发的可能性是未检出患者的40倍以上。因此,ctDNA可以用于结直肠癌的风险评估和早期复发检测。
ctDNA可成为一种潜在的动态标记物,标记肿瘤的体积和治疗反应,可以揭示肿瘤的生物学特征和临床进展。除了常规的PCR检测法,第二代测序技术的应用也可以检测到更多的突变并分析多个基因组靶点的改变,然而灵敏度较低、样本用量较大、昂贵且耗时等问题不容忽视。目前,基于第二代测序技术较常规的数字PCR、突变扩增系统等检测方法,对结直肠癌患者ctDNA中KRAS突变的诊断具有更高的准确度。随着分子生物学技术的不断优化和改善,ctDNA将可以成为结直肠癌早期检测、术后监测、治疗反应和治疗耐药性的潜在靶标,并且作为精确医学的关键部分,具有临床转化和应用的巨大潜力。
3.非编码RNA
非编码RNA(ncRNA)占人类基因组RNA的90%以上,通常不能够编码蛋白质,而是作为增殖、转录、转录后修饰、凋亡、细胞代谢等多种生物过程的重要调控因子。ncRNA的种类主要包括miRNA、lncRNA、circRNA、piRNA和小干扰RNA(siRNA)等。
miRNA是一类20~24个核苷酸的内源性非编码小RNA分子,可通过破坏靶基因的稳定性、抑制靶基因的翻译等方式发挥生物学作用。例如,miR-944通过PI3K-AKT通路增强KRAS表达水平进而在结直肠癌中发挥癌基因样作用。同样,miR-182在结直肠癌细胞中高表达可通过靶向DAB2IP的Ras GTP酶激活蛋白,激活PI3K-AKT-mTOR途径来诱导细胞增殖并抑制细胞凋亡。越来越多的证据表明,miRNA可用于早期结直肠癌检测、预后和治疗预测。尤其是血浆/血清miRNA,具有稳定性强、便于检测的特点,具有作为肿瘤无创生物标志物的潜力。近期一项研究识别了血液中4种miRNA(miR-193a-5p、miR-210、miR-513a-5p和miR-628-3p),其结合的生物标志物可以用于检测和诊断50岁以下人群是否存在非遗传性结直肠癌早发性结直肠癌。
lncRNA在结直肠癌的发生和进展中发挥了重要作用,主要机制包括:通过竞争性内源RNA机制调控特定miRNA的表达;与RNA、DNA和蛋白质相互作用,形成RNA-RNA、RNA-DNA、RNA-蛋白质复合物,通过调节转录、mRNA稳定性和翻译等多种机制调控基因表达;作为蛋白质的引导、支架或诱饵分子来招募蛋白质或RNA;影响染色质的结构等。例如,结直肠癌组织中显著上调的lncRNA NEAT1通过DDX5蛋白间接激活Wnt/β联蛋白信号通路,从而发挥致癌效应。
circRNA是一组天然存在的内源性非编码RNA,长度为数百到数千个核苷酸,它们是单链共价闭合的circRNA分子。circRNA共价闭合的环状结构可以保护它们免受外切核酸酶的降解,具有高度稳定性,是理想的生物标志物。例如,ciRS-7是研究最多的circRNA之一,它是miR-7的海绵,可导致miR-7活性降低及其靶标水平升高。研究表明circERBIN可通过miR-125a-5p/miR-138-5p/4EBP-1轴激活HIF-1α通路,是结直肠癌治疗的潜在靶点。最近一项研究发现,结直肠癌细胞中外泌体携带的circLPAR1可与eIF3h结合,竞争性抑制eIF3h与METTL3的相互作用,减少癌基因BRD4的翻译,进而抑制肿瘤生长。但是,对circRNA的研究大多是体外研究,缺乏在临床标本和患者队列中的验证,其作为结直肠癌预后及治疗生物标志物的潜力还有待开发。
piRNA具有24~31个核苷酸,最初在生殖细胞中发现,可以通过多种生物调控机制在肿瘤发生中发挥重要作用,包括转录沉默、转录后基因过程以及与多蛋白相互作用。piRNA已被用作肿瘤诊断和预后的生物标志物,并具有巨大的临床应用潜力。例如,在结直肠癌组织中piR-1245的下调能够特异性激活P53通路,沉默piR-1245能够抑制HCT116和SW480细胞的增殖并促进细胞凋亡。另一项研究表明,血清piR-54265可作为结直肠癌筛查、早期诊断和临床监测的有价值的生物标志物。尽管目前对于piRNA的研究还不够深入,存在许多未知的挑战,但多组学、第二代测序技术和其他分子流行病学技术的应用,将为探索piRNA在肿瘤发生中的作用机制及其在肿瘤诊断和治疗中的应用前景提供更深入更全面的评估。
(三)易感性生物标志物
易感性生物标志物是反映机体对环境暴露、化学致癌物、毒作用等敏感程度的指标。由于易感性的不同,性质与剂量相同的化学物质在不同个体中引起的毒作用常有很大的差异,这种差异的产生是多种因素综合作用的结果,其中遗传因素起到了十分重要的作用。以单核苷酸多态性为主的遗传变异,在阐明疾病发生发展时个体对环境危险因素的易感与耐受、评估疾病临床表现等方面都起着重要作用。因此,筛选具有遗传易感性的结直肠癌高危人群,进而对其采取针对性的预防措施,对降低结直肠癌发病率和死亡率具有重要意义。
随着分子生物学和生物信息技术的快速发展,日益降低的检测成本和不断提升的检测通量促使遗传易感性研究不断衍生发展,全基因组关联分析(genome-wide association study,GWAS)和第二代测序技术等应运而生,成为研究肿瘤等复杂疾病遗传易感性强有力的工具。全基因组关联分析利用高通量的基因分型平台同时检测几十万甚至上百万个遗传变异,同时具有大样本量和多阶段验证的设计特点,研究效率很高,为疾病的早期预防提供了可能。遗传易感性研究根据其研究设计的不同特点,包括基于候选基因策略和基于全基因组关联分析策略的易感性研究。
1.候选基因策略的易感性研究
候选基因策略是研究者根据已知的基因结构或功能特点,提出某个或某些(通常是几个或几十个)基因可能与待研究疾病易感性存在关联的科学假设。基于该假设,选择位于特定基因上的一定数量的遗传变异位点,并对其与疾病易感性的关系进行研究。这种研究设计的优点是比较容易开展,科学假设明确,便于阐述遗传标志与疾病易感性的潜在作用机制,缺点是单次研究所涉及的基因和遗传标志数量有限,效率不高。例如,结直肠癌病例和对照研究发现了许多与结直肠癌发生发展相关信号通路上重要基因的遗传变异与结直肠癌易感性显著相关,包括DNA修复通路、JAK-STAT信号通路、生物钟昼夜节律通路、雌激素代谢通路等。例如,基于中国人群两阶段病例对照研究中发现,在所有影响癌症驱动基因MYC结合的遗传变异中,KBTBD11基因上的遗传变异rs11777210与结直肠癌易感性显著相关,且rs11777210与rs6983267存在显著的相互作用,携带rs6983267GG和rs11777210CC基因型者比携带rs6983267TT和rs11777210TT基因型者对结直肠癌的易感性高2.83倍。此外,基于PD-L1/CTLA-4免疫检查点通路中的基因发现,携带rs2681416A等位基因的人群发生结直肠癌的风险是携带G等位基因的人群的1.37倍,rs2681416可以调控IQCB1的表达,导致肿瘤微环境中Th17细胞的免疫炎性损伤,进而促进结肠癌的发生。
2.全基因组关联分析策略的易感性研究
检测方法和技术的飞速发展使GWAS成为现实。GWAS所采用的研究样本量一般都非常大,并进行多个独立的后期验证,可以全面地观察全基因组遗传变异,又能有效避免候选基因策略常常出现的假阳性问题。迄今为止,GWAS已经确定了近百个独立的结直肠癌易感基因座,为结直肠癌的潜在生物学机制提供了更深入的了解(表1-2-2)。Tomlinson等于2007年首次基于欧美人群,确定了染色体8q24.21区域与结直肠癌易感密切相关的位点rs6983267,且该结果在后续验证集中也得到了重复。一项对GWAS数据的荟萃分析确定了四个新的结直肠癌易感相关遗传变异rs4444235,rs9929218,rs10411210和rs961253。针对亚洲人群,也有研究发现了多个种族特异的结直肠癌易感位点。例如,基于中国人群的三阶段病例对照研究发现,位于染色体12p13.2区域的ETV6基因的rs2238126与结直肠癌易感性相关。另一项基于东亚人群的四阶段结直肠癌病例对照研究确定了6个与结直肠癌风险相关的基因座,分别是10q22.3(rs704017),10q25.2(rs11196172),11q12.2(rs174537、rs4246215、rs174550、rs1535),12p13.31(rs10849432),17p13.3(rs12603526)和19q13.2(rs1800469、rs2241714)。
表1-2-2 目前全基因组关联分析报道的结直肠癌易感位点

续表

注:OR.比值比(odds ratio)/优势比(odds ratio)。
GWAS研究发现了大量疾病易感基因和位点,为揭示复杂性疾病的遗传机制以及疾病风险预测奠定了科学基础。由于复杂性疾病的发生受控于多基因多位点,单个或少数基因位点的效应较弱,无法准确预测疾病,因此需要综合多基因多位点信息,而多基因风险评分(polygenic risk score,PRS)是目前的常用策略,也是复杂性疾病遗传易感性研究的新阶段。PRS旨在量化多个基因或位点的累积效应,将数十、数百、数千甚至更多的基因组变异信息浓缩成衡量个体疾病易感性的分值。其最常用的构建方法包含两个步骤:首先是“变量选择”的过程,以确定哪些易感性位点需要包含在模型中;其次是“权重估算”,以获得需要附加到所选变量的系数或权重。近期研究表明,PRS通过整合多个遗传易感位点的信息,能够提高人群风险预测、筛查及干预的效果,是实现复杂性疾病精准预防的关键。例如,一项基于英国生物银行中346 297名参与者的研究通过GWAS确立的95个结直肠癌风险位点来构建PRS,研究发现,在具有高风险结直肠癌的人群中(高PRS评分者)保持健康的生活方式使得结直肠癌的风险降低了近40%;而在结直肠癌低风险(低PPS评分)人群中,保持健康生活方式使得结直肠癌的风险下降仅25%左右。
此外,GWAS研究还可以用于理解性状的遗传结构、解释遗传度和探究不同表型之间的因果关联。孟德尔随机化分析就是较为经典的探索暴露与结局之间因果关联的方法,通过使用基因型来代替暴露因素,研究暴露因素对结果的影响。例如,使用GWAS确定的与身体质量指数和腰臀比独立相关的易感位点,通过孟德尔随机化分析发现,较高的身体质量指数(body mass index,BMI)与结直肠癌发生风险相关(OR=1.16),且这种因果关联在结肠、近端结肠、远端结肠、直肠中较为相似。
尽管GWAS研究发现了大量与结直肠癌相关的易感位点,但是由于对复杂的基因调控网络的理解尚不完善,因此也导致对GWAS结果的解读存在一定困难。在此基础上,随着后GWAS时代的到来,包括全转录组关联分析等研究方法的开发,允许越来越多的研究侧重于利用多组学数据和功能试验对潜在的致病位点进行解析。全转录组关联分析研究基于基因型的表达,建立起受遗传调控的基因表达与性状之间的关联,为探索人类复杂性状或疾病相关的关键基因提供了有效手段。例如,在欧洲人群中应用基因表达预测模型和GWAS数据,在58 131例结直肠癌病例和67 347例对照中评估了遗传预测的基因表达与结直肠癌的风险关联,发现了25个与结直肠癌风险相关的基因,包括五个位于新基因座的基因,即PYGL(14q22.1)、RPL28(19q13.42)、CAPN12(19q13.2)、MYH7B(20q11.22)和MAP1LCA(20q11.22)。随着多组学整合研究的深入,单细胞测序和代谢分析等研究手段的发展和普及,必然将结直肠癌的遗传易感性与分子病理机制紧密相联,为结直肠癌的分子流行病学研究开拓新的局面。
(王美林)