Science | 汤富酬研究组与合作者揭示人类结直肠癌发病新机制
2018年11月30日,北京大学生物医学前沿创新中心(BIOPIC)、北京未来基因诊断高精尖创新中心(ICG)汤富酬研究组,与北医三院付卫研究组、乔杰研究组,在《Science》期刊发表了题为“Single-cell Multi-omics Sequencing and Analyses of Human Colorectal Cancer”的研究论文。该研究在国际上首次从单细胞分辨率、多组学水平深入解析了人类结直肠癌在发生和转移过程中,基因组拷贝数变异、DNA甲基化异常及基因表达改变的特点及相互关系。
结直肠癌是发病率和死亡率很高的一种癌症。基因组不稳定性、表观遗传学异常及基因表达紊乱等是结直肠癌典型的分子特征。肿瘤组织具有很强的异质性,以往在大量细胞水平的研究只能反映肿瘤组织的系综平均情况,而无法精准区分不同的肿瘤亚克隆以及肿瘤微环境中的其他细胞类型。一般的单细胞单组学测序技术只能分别研究单细胞基因组、单细胞DNA甲基化组、或者单细胞转录组,不能做到在一个单细胞中同时平行分析多个组学层面。汤富酬研究组对该课题组已发表的scTrio-seq(single-cell triple omics sequencing technique)技术进行了大幅度的优化,极大地提升了对单个细胞转录组的检测效率和DNA甲基化位点(CpG位点)的覆盖度,达到与利用完整单细胞进行高精度转录组分析、或者利用完整单细胞进行高精度DNA甲基化组分析相近的效果。在HEp-2细胞系中,单个完整细胞的高精度转录组测序平均可以检测到9,158个基因的表达,而scTrio-seq2的转录组部分平均可以检测到8,106(88%)个基因的表达;DNA甲基化组方面,scTrio-seq2的DNA甲基化组部分和单个完整细胞的高精度DNA甲基化组测序(scBS-seq)均可以检测到1600多万个CpG位点。该研究对患有结直肠癌并伴随转移的12例患者的原发位、淋巴结转移位、肝转移位等样品进行了多点取样,对1,800多个细胞进行了高精度的单细胞多组学测序(scTrio-seq2),共产生了7.6 Tb高质量的测序数据。scTrio-seq2的DNA甲基化组部分,平均每个细胞的测序量为4.1 Gb,平均覆盖到全基因组范围的870多万个CpG位点;scTrio-seq2的转录组部分,平均每个细胞测序量为0.9 Gb,平均可覆盖到3700多个基因。
图1. 课题研究思路及多点取样示意图
该研究的主要发现有:
(1)基于DNA甲基化组数据推断出的基因组拷贝数变异精准鉴定了肿瘤细胞的亚克隆。该研究精准鉴定出了结直肠癌患者单个癌细胞的染色体拷贝数变异谱,并利用其高精度的染色体内断点信息进行了肿瘤细胞的谱系追踪。对于其中5例患者,在每个患者肿瘤组织中鉴定出了多个(6-13个)肿瘤细胞亚克隆,发现原发位肿瘤的亚克隆结构通常比转移位肿瘤更复杂。
图2. CRC01患者癌细胞的单细胞染色体拷贝数变异谱
图3. CRC01患者癌细胞的单细胞染色体拷贝数变异的断点
图4. CRC01患者的肿瘤亚克隆结构示意图
(2)系统解析了肿瘤细胞的DNA甲基化异质性。在全基因组水平,检测到肿瘤细胞的DNA甲基化水平普遍低于癌旁的正常上皮细胞,而且DNA甲基化降低的程度存在很大的异质性。与癌旁的正常上皮细胞相比,单个肿瘤细胞全基因组DNA甲基化水平可降低7-36%。肿瘤细胞特异性DNA低甲基化基因组区域显著富集在LTR、LINE等基因组重复序列和异染色质区域,而肿瘤细胞特异性DNA高甲基化的基因组区域显著富集在CpG岛和常染色质区域。
图5. 不同结直肠癌患者及取样部位的单细胞DNA甲基化水平
(3)阐明了DNA甲基化谱和遗传谱系的相互关系。利用鉴定出的肿瘤细胞遗传谱系信息,发现肿瘤细胞的基因组DNA甲基化谱与遗传谱系高度一致,同一块肿瘤组织中同一谱系的肿瘤细胞DNA甲基化水平高度相似,而不同谱系的肿瘤细胞DNA甲基化水平可存在很大差异。所以肿瘤组织基因组DNA甲基化的强烈异质性主要来自同一个患者肿瘤内不同亚克隆之间的DNA甲基化差异,而不是同一个亚克隆内部不同细胞间的DNA甲基化差异。
图6. CRC01患者不同遗传谱系的癌细胞的单细胞DNA甲基化水平
(4)阐释了DNA甲基化谱和基因表达谱的相互关系。在单细胞水平,基因启动子区域的DNA甲基化与相应基因的表达呈现强烈的负相关关系,而基因区的DNA甲基化与相应基因的表达呈现正相关关系。对于测序单细胞数量较多的4例结直肠癌患者,其中1例患者肿瘤细胞的转录组亚群、遗传亚群(亚克隆)、和DNA甲基化亚群三者之间呈现出一一对应关系;而在另外3例患者中,转录组亚群、遗传亚群(亚克隆)、以及DNA甲基化亚群三者之间的关系较为复杂,没有简单的一一对应关系。
图7. 肿瘤细胞的遗传谱系、DNA甲基化、基因表达三者之间单细胞分辨率的对应关系
(5)首次在单细胞分辨率追踪了同一遗传谱系的肿瘤细胞在转移过程中DNA甲基化及基因表达的变化情况。对于同一个癌症患者同一遗传谱系的肿瘤细胞在从原发灶到转移灶的转移过程中其全基因组DNA甲基化水平相对稳定,而基因组局部区域的DNA甲基化水平可能发生较大变化。上皮-间充质转化相关的重要基因在转移前后的肿瘤细胞中其RNA表达水平和DNA甲基化水平均没有发生显著改变。
图8. 同一遗传谱系的肿瘤细胞在转移过程中的单细胞分辨率的DNA甲基化水平变化
(6)揭示了结直肠癌细胞DNA去甲基化的共同特点。在全部进行了单细胞基因组DNA甲基化测序的10个患者中,肿瘤细胞的DNA去甲基化程度与相应基因组区域在癌旁正常上皮细胞中的DNA甲基化水平呈现正相关关系,也就是说,在正常上皮细胞中DNA甲基化越高的基因组区域,其DNA去甲基化越强烈(DNA甲基化降低的绝对值和降低的相对比例都更大)。DNA去甲基化的程度与基因组重复序列L1以及癌旁正常组织中H3K9me3标记的异染色质区域的分布密度呈现强烈的正相关关系,而与开放的染色质区域以及H3K4me3标记的基因组区域呈现强烈的负相关关系。与正常的早期胚胎发育过程中的两次大规模基因组DNA去甲基化相反,相比于L2基因组重复序列,进化上更为年轻、更为活跃的L1基因组重复序列经历了更强烈的DNA去甲基化。
图9. CRC01患者癌细胞相比于癌旁细胞的DNA甲基化水平
(7)揭示了结直肠癌细胞染色体水平的DNA甲基化异常和基因组不稳定性的特点。在结直肠癌细胞中,相比于其他17条染色体,有6条染色体(4号、5号、8号、13号、18号、和X染色体)倾向于发生更强烈的DNA去甲基化。其中8号、13号、和18号染色体在TCGA数据库(178个非高频点突变类型的病例样本)以及该研究的12个病例中均同时具有高频的拷贝数变异。在这6条基因组DNA去甲基化更强烈的染色体中,有5条染色体(4号、5号、8号、13号、和X染色体)也同时显著富集基因点突变(单核苷酸变异)。
图10. 结直肠癌细胞染色体水平的DNA甲基化异常和基因组不稳定性的特点
综上所述,通过对10例结直肠癌患者的高精度单细胞多组学测序分析和深度数据挖掘,该研究揭示了结直肠癌肿瘤发生和转移过程中基因组DNA甲基化变化的关键特征,提示在肿瘤发生过程中大规模的DNA去甲基化很可能是早期事件,并在后续肿瘤转移过程中保持相对不变,说明相对稳定的全基因组DNA低甲基化是结直肠癌每个肿瘤细胞的基本特征。而同一个患者的同一个亚克隆的肿瘤细胞其转录组可以仍然有强烈的异质性,并且同一个患者的不同亚克隆的肿瘤细胞可以有相同的转录组亚群,说明肿瘤细胞的转录组特征中很大一部分是对肿瘤微环境的动态响应而不完全是由其遗传谱系决定的。该研究既发现了结直肠癌细胞基因组DNA甲基化层面强烈的患者个体间差异以及个体内的肿瘤细胞异质性等个性特征,同时也发现了不同患者个体之间、不同肿瘤部位之间肿瘤细胞DNA甲基化改变的共性规律,对于基于干预DNA甲基化的肿瘤治疗方案给出了新的启示。
北京大学生物医学前沿创新中心、北京未来基因诊断高精尖创新中心、生命科学联合中心博士生卞舒惠,北京大学生命科学学院、生物医学前沿创新中心博士生侯宇、李显龙、王艺橙,以及北医三院周鑫博士、雍军博士为该论文的并列第一作者;北京大学汤富酬教授、北医三院付卫教授、乔杰教授为该论文的共同通讯作者。该研究工作得到了国家自然科学基金委员会、北京未来基因诊断高精尖创新中心、北大-清华联合中心等的资助。