开发者社区> 夜神moon> 正文

文献翻译Complex integrated analysis of lncRNAs-miRNAs-mRNAs in oral squamous cell carcinoma(2)

简介: 材料和方法 获取微阵列数据和选择数据集头颈部鳞状细胞癌的基因表达数据 (HNSCC)从Cancer Genome Atlas下载(TCGA)数据库(https://gdc-portal.nci.nih.gov/)。
+关注继续查看

材料和方法

获取微阵列数据和选择数据集头颈部鳞状细胞癌的基因表达数据

(HNSCC)从Cancer Genome Atlas下载(TCGA)数据库(https://gdc-portal.nci.nih.gov/)。根据口腔的解剖学定义,387个口腔样本(336个OSCC样品和51个正常对照样品)
从587个HNSCC数据中提取。 mRNA和miRNA表达数据包括327个OSCC样本和31个非癌样本已下载。原始lncRNAs和mRNAs 数据(HUGO基因命名委员会(HGNC)数据库
http://www.genenames.org/)包含2775个lncRNA和19004他们的靶mRNA。

从Gene获得OSCC的基因表达谱(GEO)数据库(http://www.ncbi.nlm.nih.gov / geo /)通过研究术语“口腔鳞状细胞癌”(2016年8月)。原始数据和探针注释文件GSE9844(31个OSCC样本和24个非癌对照样本)和GSE 13601(26个OSCC样品和12个非癌症控制样品)基于Affymetrix Human Genome U133 Plus 2.0 Array(Affymetrix,Inc.,Santa Clara,CA,USA)下载了探针进一步分析。

微阵列数据的预处理

CEL格式的原始数据和文件是预先通过背景校正处理,四分位数据标准化使用寡核苷酸(oligo)包进行总结和总结(http://bioconductor.org/packages/release/bioc/html/oligo.html)简而言之,原始数据被转化为可识别的表达数据。背景用标准添加方法进行校正(MSA)和lncRNA,miRNA和mRNA的表达量使用分位数方法归一化。最后,基因表达数据根据基因探针和symbol以及表达密度分布图。

鉴定OSCC中的DEG,DE-lncRNA和DE-miRNA

标准化后,对微阵列进行显着性分析(差异表达分析)采用(SAM)。edgeR包用于筛选DEGs,DE-lncRNAs和DE-miRNAs在OSCC和健康组织之间差异表达。 P值通过t检验计算值(显着性水平:p <0.05)和使用错误发现率(FDR)(<0.05)和|FC| > 1.5。之后使用Cluster软件进行有层次的分层聚类ware(3.0版,Eisen Lab,Stanford,CA,USA),使用Pearson's相关距离度量和平均链接。热图是在Cluster bb3.0和TreeView 1.60程序中生成。

与临床特征相关的DEG,DE-lncRNA和DE-miRNA

收集各种临床信息和OSCC样品根据某些临床特征分为两组(见表S1a-c)。 R的封装edgeR用于筛选出来与临床特征相关的DEG,DE-lncRNA和DE-miRNA通过设置FDR <0.05和| fold change |> 1.5作为截止点。

DEG,DE-lncRNA和DE-miRNA与预后相关

筛选无病生存(DFS)相关基因组数据,使用函数survfit进行单变量cox分析包存活调查可能的预后DEGs,DE-lncRNAs和DE-miRNAs用于无复发生存期(RFS)和总生存期(OS)。采用Kaplan-Meier方法检测DE-lncRNAs的预后价值,并统计学意义使用对数秩检验评估。进行所有分析在R 3.0.1框架上。筛选OS的独立预后因素进行多变量Cox回归分析以进行筛选预后DE-RNAs和临床病理特征是OSCC患者OS的独立预后标志物。

构建蛋白质 - 蛋白质相互作用(PPI)网络和筛选关键基因

从三个数据库BioGRID中检索的PPI对(http://thebiogrid.org/),HPRD(http://www.hprd.org/)和DIP(http://dip.doe-mbi.ucla.edu/),被整合来构建一个背景网络。 DEGs映射到PPI网络 -
工作,相互作用,信心分数超过0.4保留。之后,PPI利用Cytoscape软件可视化网络。连通度和中介性中心性分析了每个节点的(BC)。连接最多的节点(> 6个连接)被认为是中枢蛋白质。 BC
价值计算如下:使用BC值确定按BC值排名的前100。关键基因的组合
通过选择优化筛选出来。支持向量建立机器(SVM)分类模型来预测DEGs的预后效应。确认稳健性和转移 - 构建的SVM模型,GSE9884数据和GSE13601的能力数据用作验证集。模型的功效是评估 - 敏感性,特异性,阳性预测值,阴性预测值和ROC曲线下面积(AUC),使用时间依赖的接收器 - 操作员特征(ROC)曲线分析。

构建ceRNAs监管网络

DE-lncRNA和DE-miRNA对以及DE-通过计算Pearson的相关性来鉴定miRNA和DEGs
系数(PPCs)基于它们的表达水平。只有具有|coefficient|> 0.95的对被认为是共表达的。
获得了lncRNAs-miRNAs-mRNAs调节网络基于lncRNAs-miRNA和miRNA-mRNAs调节对。
DE-lncRNA与DE-miRNA之间的调节关系通过miRcode(http://www.mircode.org)预测对
starBase(http://starbase.sysu.edu.cn/)。监管关系通过miRTar-预测DE-miRNA和DEGs对之间的关​​系Base(http://mirtarbase.mbc.nctu.edu.tw)。监管对DE-miRNAs和DEGs以及DE-lncRNAs和DE-miRNAs有相反的表达趋势,彼此被选中建立监管网络。因此,DEGs和DE-lncRNAs
由相同的DE-miRNA调节被过滤掉。综合可视化lncRNA-miRNA-mRNA的共表达网络通过Cytoscape软件。此外,预后DEGs,DE-鉴定了ceRNA网络中的lncRNA和DE-miRNA,并且
这些代表性miRNA和Kaplan-Meier的存活图绘制mRNA。

功能丰富分析

用于注释,可视化和集成发现的数据库(DAVID,http://david.abcc.ncifcrf.gov/)用于功能性
浓缩分析。 GO富集和KEGG途径使用Fisher精确检验进行如下:全基因组中的基因总数; M:基因数量; K:特征基因的数量;费舍尔的得分:至少x个基因属于功能途径基因K显着表达基因。Fisher的精确测试用于对GO类别进行分类,并且计算FDR以校正p值(显着性)水平<0.05)。

鉴定转录因子(TF)-miRNAs-lncRNAs网络

TF-miRNA调节对从TRRD获得和JASPAR数据库并映射到整个ceRNA的共表达网络。
TF-miRNAs-lncRNAs调节环通过结合TF-miRNA和miRNAs-lncRANs调控对,然后构建TF-miRNAs-lncRNAs网络

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《Understanding and Improving Layer Normalization论文》电子版地址
Understanding and Improving Layer Normalization论文
17 0
Text to image综述阅读(2)A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis
这是一篇用GAN做文本生成图像(Text to Image)的综述阅读报告。 综述名为:《A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis》,发表于2019年,其将文本生成图像分类为Semantic Enhancement GANs, Resolution Enhancement GANs, Diversity Enhancement GANs, Motion Enhancement GANs四类,并且介绍了代表性model。
67 0
【推荐系统论文精读系列】(十四)--Information Fusion-Based Deep Neural Attentive Matrix Factorization Recommendation
推荐系统的出现,有效地缓解了信息过载的问题。而传统的推荐系统,要么忽略用户和物品的丰富属性信息,如用户的人口统计特征、物品的内容特征等,面对稀疏性问题,要么采用全连接网络连接特征信息,忽略不同属性信息之间的交互。本文提出了基于信息融合的深度神经注意矩阵分解(ifdnamf)推荐模型,该模型引入了用户和物品的特征信息,并采用不同信息域之间的交叉积来学习交叉特征。此外,还利用注意机制来区分不同交叉特征对预测结果的重要性。此外,ifdnamf采用深度神经网络来学习用户与项目之间的高阶交互。同时,作者在电影和图书这两个数据集上进行了广泛的实验,并证明了该模型的可行性和有效性。
76 0
【推荐系统论文精读系列】(十二)--Neural Factorization Machines for Sparse Predictive Analytics
现在很多基于网站应用的预测任务都需要对类别进行建模,例如用户的ID、性别和职业等。为了使用通常的机器学习预测算法,需要将这些类别变量通过one-hot将其转化成二值特征,这就会导致合成的特征向量是高度稀疏的。为了有效学习这些稀疏数据,关键就是要解释不同特征之间的影响。
99 0
Bag of Tricks for Efficient Text Classification 论文阅读及实战
Bag of Tricks for Efficient Text Classification 论文阅读及实战
111 0
Paper:《A Unified Approach to Interpreting Model Predictions》论文解读与翻译
Paper:《A Unified Approach to Interpreting Model Predictions》论文解读与翻译
320 0
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第五章~第八章(一)
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第五章~第八章
83 0
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第五章~第八章(二)
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第五章~第八章
74 0
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章(二)
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章
77 0
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章(一)
CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章
75 0
+关注
夜神moon
南方医科大学外科硕士
文章
问答
文章排行榜
最热
最新
相关电子书
更多
Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star Generative Adversarial Networks
立即下载
Understanding and Improving Layer Normalization论文
立即下载
Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition
立即下载