-
Abstract
目的:
本研究旨在通过基因表达数据揭示口腔鳞状细胞癌(OSCC)中lncRNAs-miRNAs-mRNA的调控网络。
材料与方法:
差异表达的lncRNAs,miRNAs和mRNAs(截止值:假阳性率(FDR)<0.05和|差异倍数|> 1.5)。进行Cox回归分析以筛选预后因素。 OSCC与总生存期(OS)和无复发生存期(RFS)相关。使用BioGRID,HPRD和DIP构建蛋白质 - 蛋白质相互作用(PPI)网络用于差异表达的mRNA。从排名前100位的差异表达的mRNA中鉴定出关键的中枢基因,将LnRNA-miRNA和miRNA-mRNA调控网络构建并组合成ceRNAs调控网络。使用Fisher精确检验鉴定基因本体论和kegg途径。
结果:
共鉴定出929个差异表达的mRNA,23个差异表达的lncRNA和29个差异表达的miRNA。 59个mRNA,6个miRNA(hsa-mir-133a-1,hsa-mir-1-2,hsa-mir-486,Hsa-mir-135b,hsa-mir-196b,hsa-mir-193b)和6个lncRNA( C10orf91,C2orf48,SFTA1P,FLJ41941,PART1,TTTY14)与OS有关;和52个mRNA,4个miRNA(hsa-mir-133a-1,hsa-mir-135b,hsa-mir-196b,hsa-mir-193b)和2个lncRNA(PART1,TTTY14)与RFS相关。获得了含有37个关键中枢基因的支持向量机(SVM)分类器。构建了含有417个节点和696个边缘的ceRNA调控网络。 ECM受体相互作用,细胞因子 - 细胞因子受体相互作用,粘着斑,花生四烯酸代谢和p53信号通路在网络中显着富集。
结论:
这些发现揭示了OSCC的发病机制,可能提供潜在的治疗靶点。
作者做的思路很整洁,初始是比较常规的差异分析,基于得到的差异基因,作者做了生存相关分析/共表达网络/kegg等等。利用聚类得到的两类患者(N-T),作者的svm准确度(AUC)得到了99%。
Result
鉴定差异lncRNA,miRNA和DEG
共下载鉴定869个lncRNA,1046个miRNA和18624个mRNA。排除其中表达低丰度的lncRNAs(<1),miRNAs(<5)和mRNAs(<5),最终保留410个lncRNA,157个miRNA和11792个mRNA(图S1)。使用差异表达分析后筛选出23个DE-lncRNA,29个DE-miRNA和929个DEG(图S2)。
临床特征相关的DE-lncRNA,miRNA和DEGs
所有样品根据确定临床资料分为两组,DE-miRNAs(S1a表),DE-mRNAs(S1b表)和DE-lncRNAs(S1c表)与各种临床相关性。
预后相关mRNA,miRNA和lncRNA
单变量cox分析鉴定共有59个mRNA,6个miRNA和6个与OS相关的lncRNA(S2a表),52个mRNA,4个miRNA和2个lncRNARFS相关(S2b表)。与OS和RFS相关的这些lncRNA的Kaplan-Meier图是如图1和2所示。
确定OS的独立预后因素
多变量Cox回归分析显示三者lncRNAs(C10orf91,C2orf48,TTTY14),三种miRNAs(hsa-mir-486,hsa-mir-193b,hsa-mir-196b),27种mRNA和几种临床表现特征被确定为独立的预后因素OSCC患者的OS(p <0.05)(S3c表)。
PPI网络
一个包含339个node和486个edge的PPI网络构造出来(图2)。其次得到一组关键基因(图S4b)。当核心基因数量基因选择为37时,准确率达到峰值0.994。最高程度的中枢基因是CDK1(Degree = 25),受miR-133a,miR-135b,miR-31和miR-调节375(S4表,S7表)。在37个关键基因的散点图中,每个都是一组样品聚集在一起,两组样品可以清楚地分开(图3a-c);在ROC曲线中(图3a-c),TCGA数据的曲线下面积(AUC),数据集GSE9884,数据集GSE13601分别为99.9%,94.2%和97.8%。TCGA数据,数据集GSE9884和数据集的正确率GSE13601分别为99.4%,86.8%和94.5%(S5表)。
ceRNAs调控网络
共有23对lncRNA-miRNA相互作用(S6表)由8对DE-lncRNA和11对DE-miRNA用来lncRNA-miRNA调节网络(图4A)。十德预测除miR-139外的miRNA具有靶DEG。一个共有673个监管关系(S7表)合计10个DE-miRNA和673 DEG用于构建miRNA-mRNA调控网络(图4B)。十一个DEG(ANLN,CDK1,GADD45G,HMMR,IGF2BP3,IL24,MEIS1,PBX1,RAD51,SATB1,TTN)不仅是关键的枢纽基因,还涉及miRNAs-mRNAs网络。上面提到的两个网络构成的lncRNAs-miRNAs-mRNAs调控网络(图4C)包括 417个节点和696个边缘。通过绘制预后相关DEG,DE-lncRNA和DEmiRNAs转化为构建的ceRNA网络,发现有两种lncRNAs(PART1,TTTY14),4种miRNAs(hsa-mir-133a-1,hsa-mir-135b,hsa-mir-196b,hsa-mir-193b),27个mRNA 与OS相关且参与了ceRNAs网络(S8a表);但是只有一个miRNA(hsa-mir-135b)和与RFS相关的16种mRNA参与ceRNA网络(S8b表)。
功能富集分析和TF-miRNAs-lncRNAs网络的构建
这些代表性miRNA和mRNA的Kaplan-mier生存分析图显示在S5-S8。共发现了25种不同的基本GOterm截断值p <0.05且FDR <0.05(图5A,S9-b表)。在这些术语中,胶原纤维组织和骨骼
系统开发是最重要的。五条KEGG路径,包括ECM-受体相互作用,细胞因子 - 细胞因子
受体相互作用,粘着斑,花生四烯酸代谢,p53信号通路(图5B,S9a表,p <0.05)。在这5条途径中,最重要的途径是ECM受体相互作用;最大数量的mRNA是细胞因子 - 细胞因子受体相互作用途径。将TF-miRNA调控对映射到ceRNA网络后,发现转录因子MEIS1参与其中MEIS1-miRNAs-lncRNAs之间的调控网络(图6)。
ceRNA网络部分处理比较乱,似乎是通过SVM预测N/T,这似乎应该归于诊断模型而不是预后模型