医学论文哪里有?本研究对不同组学影响直肠腺癌复发和转移的特征基因比对分析,发现多组学中影响直肠腺癌复发和转移的特征基因主要集中于 6 号染色体短臂和 13 号染色体长臂,19 号短臂区域。DNA 甲基化水平与转录组水平交集特征基因主要参与细胞迁移的正向调控、血管生成的正向调控以及对生长因子刺激的应答;DNA甲基化水平与拷贝数变异水平交集特征基因主要参与磷酸盐的代谢、阳离子稳态以及细胞对生长因子刺激的应答生物过程。
第1章 前言
1.2 DNA 甲基化研究进展
DNA 甲基化是指在 DNA 甲基转移酶的催化下,甲基(CH3-)从 S-腺苷甲硫氨酸供体转移到 DNA 中胞嘧啶碱基的 C5 位处的过程[8],其中,经过甲基修饰后的碱基叫做“5-甲基胞嘧啶”,简称为 5mC[9],经过修饰之后的 CpG 位点称为甲基化位点(Methylated loci)。DNA 甲基化代表着基本的表观遗传修饰,在细胞周期、细胞增殖、细胞凋亡、DNA 复制、染色质结构和基因转录等生物过程中扮演着重要作用。在许多疾病中,如癌症、退行性疾病以及衰老等都表现出异常的甲基化模式影响疾病表型的变化[10]。因此,以基因 DNA 甲基化水平的变化作为切入点探究疾病的分子分型或病理机制已成为表观遗传学中的研究热点。Wang 等应用 WGCNA 算法结合 lasso 回归算法发现 C20orf56, BTG2, C13orf16 等9 个基因的甲基化位点是肺腺癌的预后靶标[10]。Westerman 等应用 WGCNA 算法和 Comb-p 算法计算甲基化区域和甲基化模块,发现 SLC9A1,SLC1A5 和TNRC6C 甲基化与心血管疾病的患病风险密切相关[11]。
目前针对于 DNA 甲基化数据的研究主要集中于基于 DNA 甲基化位点识别方法的研究和基于 DNA 甲基化区域识别方法的研究。基于 DNA 甲基化位点识别方法的研究中,张等针对于 DNA 甲基化数据非正态分布和高异质性的特性,提 出 了 基 于 相 对 熵 的 差 异 甲 基 化 位 点 识 别 方 法 — — QDML (Quantitative identification of Differentially Methlated Loci),以解决数据因非正态分布而造成高假阳性率的问题,相比于 t-test、Wilcox、Combined t-test 三种传统差异分析方法,该方法具有高高检测能力、高精度,低假阳性率的特点[8],但该方法仍无法处理实验组和对照组数据未匹配的问题。为解决因生物变异而造成的样本间批次效应和组内误差,宋等提出一种基于 Elastic Net 正则化的差异甲基化位点识别方法,该方法应用逻辑回归作为分类器对实验组与对照组进行分类,筛选对分类性能具有重要贡献的特征,进而,将这些特征定义为差异甲基化位点。该方法意在找到尽可能多的代表两组数据集差异特征的甲基化位点,相比于传统假设检验分析方法 FastDMA、RnBeads,该方法得到更高的正确率,模型的稳定性更高[12]。
第 3 章 基于转录组学的直肠腺癌病理机制研究及预后靶标识别
3.1 材料方法
数据分析流程如下:
3.1.1 数据预处理和样本质控分析
本研究中直肠腺癌转录组数据集和临床随访数据集下载于 TCGA 数据库。并选择包含 171 个临床样本信息数据集的 M、N、T、Stage、Event、Sex、Age七个临床特征作为评价指标;在转录组数据集上,本研究选择 165 个样本癌组织转录组数据集和 9 个样本癌旁组织转录组数据集,其中包括 60483 个基因的FPKM 值。
在数据的预处理上,首先,删除缺少临床数据的样本,仅保留存在于临床数据集和癌症组织转录组数据集中的样本。最后,进行层次聚类分析以从癌症组织基因表达数据集中去除异常值。在集群包中使用 R 函数clus(t)进行分层聚类[53]。
第 5 章 影响直肠腺癌转移和复发的多组学特征基因
5.1 材料方法
5.1.1 不同组学特征基因染色体分布情况分析
M、N、T 分期是评价实体瘤发生发展的重要指标[90]。为探究直肠腺癌转移和复发的关键机制,本研究首先对上述转录组水平、DNA 甲基化水平、拷贝数变异水平分析影响 M、N、T 表型变化的特征基因进行整合并分别取并集,得到不同组学影响直肠腺癌转移复发的特征基因群。进而探究不同组学特征基因在染色体上分布情况,本研究将不同组学特征基因群映射到染色体上,其中,基因信息注释应用R 函数getBM()实现,基因组信息可视化应用 R 函数ideogram()实现。
5.2 结果
5.2.1 不同组学特征基因染色体分布情况分析
为探究不同组学中特征基因的分布情况,我们将在 DNA 甲基化水平上、拷贝数变异水平上、转录组水平上特征基因群比对至染色体上,发现在 DNA 甲基化水平上影响直肠腺癌的复发和转移的特征基因主要分布于 6p21 区域、19p13区域、1p36 区域、13q34 区域和 5q35 区域;在拷贝数变异水平上影响直肠腺癌的复发和转移的特征基因主要分布于 17p13 区域、6p12 区域、13q14 区域、6q21区域、16p11 区域、8q24 区域;在转录组水平上影响直肠腺癌复发和转移的特征基因主要分布于 3p21 区域、11q13 区域、17q25 区域、12q13 区域、19p13 区域(图 5.1)。
综上所述,本研究发现在拷贝数变异水平和 DNA 甲基化水平,影响直肠腺癌复发和转移的基因主要分布于 6 号染色体短臂和 13 号染色体长臂,19 号短臂是影响 DNA 甲基化和转录组、以及拷贝数变异变化的主要区域。
第 6 章 结论
本研究针对直肠腺癌 DNA 甲基化芯片数据构建 DNA 甲基化加权基因调控网络模型,从 DNA 甲基化角度分析直肠腺癌的病理机制及预后靶标,接下来地,针对直肠腺癌转录组数据构建基于基因共表达网络结合社群发现算法及PageRank 算法的网络分析模型,从转录组角度探究影响直肠腺癌的复发和转移机制和预后靶标;为探究拷贝数变异水平上影响直肠腺癌转移和复发的关键机制,本研究针对直肠腺癌拷贝数变异数据构建基于随机森林的遗传算法探究直肠腺癌转移和复发机制;最后,本研究将 DNA 甲基化水平、转录组水平、拷贝数变异水平上特征基因映射到染色体上,探究影响直肠腺癌复发和转移的关键染色体区域。结论如下:
从 DNA 甲基化水平上分析,本研究发现与直肠腺癌的复发和转移密切相关主要为成纤维细胞生长因子的趋化、以微管和鞭毛为主的细胞骨架形成的调控相关生物过程、突触发生的调节以及细胞有丝分裂的调控密切相关生物过程、以及与细胞外基质的调控、微丝形成的调控的生物过程密切相关的生物过程;MAP4(cg04441191) 、 KSR2(cg05658717) 、 GRIN2A(cg09622330) 、YWHAG(cg10698404) 、 SPAG9(cg17047993) 、 CEP135(cg24504843) 、CEP250(cg24531267)七个基因的甲基化位点与直肠腺癌预后密切相关。
从转录组水平上分析,本研究发现细胞发育和分化,以及血管和神经系统的发育,两类生物学过程共同影响肿瘤的微环境,进而影响直肠腺癌的复发和转移。MMP14、SDC2、ACTA2、ZNF532,和 CYBRD1 在直肠腺癌的侵袭和转移上发挥重要作用,并与直肠腺癌的预后密切相关。
从拷贝数变异水平上分析,本研究发现影响临床表型 M 变化的特征基因主要参与线粒体相关的能量代谢、细胞对生长因子刺激的反应,以及细胞对肽激素刺激的应答反应;影响临床表型 N 变化的特征基因主要参与与突触相关的神经信号转导;影响临床表型 T 变化的特征基因主要参与与细胞间电信号的转导。MLIP、GCM1、GFRAL、GSTA3、MIR586 的拷贝数异常与直肠腺癌预后呈现非线性相关。
参考文献(略)