Whole-Genome Expression Microarray Combined with Machine Learning to Identify Prognostic Biomarke...

2018-09-26 1451

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 摘要本研究的目的是建立一个框架，以更好地了解高级别胶质瘤（HGG）预后相关的生物标志物。进行全基因组基因表达微阵列以鉴定HGG和低级弥漫性神经胶质瘤之间的差异表达基因。

摘要

本研究的目的是建立一个框架，以更好地了解高级别胶质瘤（HGG）预后相关的生物标志物。进行全基因组基因表达微阵列以鉴定HGG和低级弥漫性神经胶质瘤之间的差异表达基因。几种机器学习算法用于过滤预后相关基因。选择手术切除后的一千九百名HGG患者进行生存分析。对这些肿瘤样品进行免疫组织化学分析，以分析WEE1的IDH1突变状态和蛋白表达。进行qRT-PCR，蛋白质印迹，transwell测定和划痕伤口愈合测定以评估WEE1敲低或在HGG细胞中过表达的效果。三种预后相关基因（WEE1，IGF2PB3和EMP3）被证明可将HGG患者分成两个不同的存活亚组。ROC曲线WEE1下的面积高于IGF2BP3，EMP3，年龄，IDH状态，1p / 19q状态和MGMT启动子状态。与IDH状态，年龄和WHO等级相比，WEE1是一个独立的协变量。敲除或过表达WEE1可抑制或促进U251和U87细胞系的迁移和侵袭。 WEE1，EMP3和IGF2BP3是mRNA水平上可靠的预后相关基因。 WEE1是生存分析中独立的预后生物标志物，对HGG患者具有潜在的诊断价值。 WEE1可在体外诱导HGG细胞迁移和侵袭。

患者和方法患者

从7个低级弥漫性神经胶质瘤和7个HHG（4个WHO III弥漫性神经胶质瘤和3个GBM）患者中收集的14个肿瘤样品被包括在全基因组基因表达微阵列分析中。用于定量逆转录聚合酶链反应（qRT-PCR）的六个正常成人脑样品来自于接受过原发性癫痫手术的患者。用于RNA分离的所有样品均于2012年1月至2012年2月期间通过天津环湖医院手术切除获得。 2013年3月至2015年12月，在天津环湖医院的存档患者中，共有93个符合条件的HGG样本用于免疫组织化学（IHC）和生存分析。生存信息随访时间超过2年。术后选择的治疗方案与中国胶质瘤合作组（CGCG）临床实践指南相似（Jiang等，2016）。本研究中使用的所有手术切除肿瘤样本在患者接受放射和/或化疗之前是原发性肿瘤。如果根据2016年WHO弥漫性胶质瘤分类标准三名神经病理学家在组织学上确定了他们的诊断，则患者符合研究资格。
本回顾性研究方案和收购的肿瘤样本经环境委员会和环湖医院机构审查委员会批准。根据赫尔辛基宣言，从患者获得书面知情同意书。
RNA提取和全基因组表达分析

用于RNA提取的肿瘤组织在手术切除后立即在液氮中快速冷冻。根据制造商的方案提取总RNA。使用Agilent SurePrint G3 Human GE Microarray 18×60K（Design ID-028804，Shanghai，China）分别对所有样品进行微阵列分析。微阵列杂交过程在Senichip Company（中国上海）进行。在R版本3.3.2完成原始数据预处理后获得基因表达数据集。使用R语言limma包，选择差异表达的基因（DEG）作为|FC|≥2并且矫正P值<0.05。 HGG中的高表达DEG用于生物信息学分析（图1a）。原始数据上传至NCBI的Gene Expression Omnibus（GEO）GSE106784。

对已发布数据集的再分析

本研究重新分析了公开数据库中的六个数据集（补充表1）。 CGGA RNA-seq用于进行WGCNA分析和LASSO回归模型。我们使用pamr，sva，affy和impute包去合并TCGA LGG RNA-seq和TCGA GBM RNA-seq数据。在合并两个数据集后，我们得到了一个批次校正的mRNA表达矩阵去建立 LASSO回归模型，仅包含HGGs。 CGGA数据和GSE16011用于验证候选预后相关基因的预后意义。 TCGA全胶质瘤RNA-seq含有全级弥漫性胶质瘤，用于诊断WEE1与其他胶质瘤相关危险因素之间的相关性。在本研究中排除了从没有预后信息的所有数据集中选择的样本

机器学习和统计分析

WGCNA由BWGCNA ^ R包进行（Cut-Height = 0.9，minSize = 10）。确切的算法显示在https://cran.r-project.org/web/packages/ WGCNA / index.html。 LASSO回归模型由Bglmnet ^ R包进行。通过LASSO溶液中的交叉验证选择最佳收缩参数（λ）的值。具有非零系数的基因被认为是最具潜在预后相关的基因。确切的算法显示在https://cran.r-project.org/web/packages/glmnet/ glmnet.pdf。 Kaplan-Meier曲线和对数秩检验用于分析预后功能的存活率验证。使用单变量和多变量Cox比例风险（PH）回归模型来评估WEE1是否是独立的预后生物标志物。 Schoenfeld残差（Kasal等人，2004）和偏差残差（Jain等人，2012）方法被用来评估Cox PH回归模型假设的有效性。总体存活率（OS）和无进展生存期（PFS）在之前的文献中被定义（Rossietal，2012）。如果没有另外提及，对于所有测试，显着性水平设定为P <0.05。
免疫组化

免疫组化
我们使用IHC分析福尔马林固定和石蜡包埋（FFPE）组织的IDH状态（Capper等人2010; Capper等人2009）和WEE1蛋白质表达（Music等人2016）。用初级抗IDH1-R132H（1：100，克隆H09，Dianova，汉堡，德国）和初级抗WEE1（1：100，SC-5285，Santa Cruz Biotechnology，Shanghai）进行IDH1-R132H和WEE1的IHC染色。，中国）抗体。 IHC协议先前已详细描述（Zhang et al.2012）。 IDH1-R132H的细胞质阳性被认为是突变的证据（Capper等人，2009）。 WEE1阳性表达被分级为超过50％的细胞核被染色。 IHC染色的切片由三位独立的病理学家进行评估和评估

质粒载体和细胞培养
所有质粒均获自OriGene Technologies（Rockville，MD，USA）。质粒载体pRFP-C-RS shWEE含有两种不同的WEE1特异性序列（shWEE1-1和shWEE1-2），其选自四种不同的WEE1序列以减少脱靶效应。含有WEE1变体序列的表达载体pCMV6-WEE1-GFP用于过表达。用Lipofectamine 3000（Invitrogen，Shanghai，China）介导的质粒载体转染HGG细胞系U251和U87。细胞培养方案与我们之前的研究中使用的相同（Zhang et al.2012）

qRT-PCR和Western Blotting
qRT-PCR和蛋白质印迹的过程与我们之前的研究相同（Zhang等人，2012）。对于qRT-PCR，引物序列列于补充表2中。对于蛋白质印迹，我们使用针对WEE1的一抗（1：1000;目录号ab203236，Abcam，中国上海）和GAPDH（1：5000;目录号。 ab181603，Abcam，上海，中国）。

文章标签：

算法

Whole-Genome Expression Microarray Combined with Machine Learning to Identify Prognostic Biomarke...

摘要

患者和方法患者

对已发布数据集的再分析

机器学习和统计分析

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Whole-Genome Expression Microarray Combined with Machine Learning to Identify Prognostic Biomarke...

摘要

患者和方法患者

对已发布数据集的再分析

机器学习和统计分析

热门文章

最新文章

相关电子书