Establishment of a SVM classifier to predict recurrence of ovarian cancer

简介: 摘要使用卵巢癌(OC)的基因表达数据用于鉴定感兴趣的基因和支持向量机(SVM)分类器预测OC的复发。三个数据集(GSE17260,GSE44104和GSE51088)从Gene Expression下载。

摘要

使用卵巢癌(OC)的基因表达数据用于鉴定感兴趣的基因和
支持向量机(SVM)分类器预测OC的复发。三个数据集
(GSE17260,GSE44104和GSE51088)从Gene Expression下载
。样品中差异表达的基因(DEG)来自非复发性和复发性OC的患者被
同质性测试和质量控制分析展示。随后是蛋白质 - 蛋白质相互作用(PPI)网络,使用来自Biological General的数据为DEGs建立
交互数据集的存储库,人类蛋白质参考交互蛋白的数据库和数据库。
互动和中介中心性(BC)得分为PPI网络中的每个节点计算结果。前100个基因选择BC分数排名以筛选特征基因,通过使用GSE17260数据集的递归特征消除。在此之后,进一步构建SVM分类器,使用GSE44104和GSE51088数据集和TCGA数据集验证。共鉴定出639个DEG来自三个基因表达数据集和PPI网络。构建了包括249个node和354个edge。一个基于SVM由39个特征基因组成的分类器(包括XXX)是随后建成的。 模型预测的准确性在数据集上GSE17260,GSE44104和GSE51088数据的SVM分类器 以及从TCGA,分别为92.7%,93.3%,96.6%和90.4%。 而且,本研究结果显示预测为非复发性OC的患者的存活时间显着延长相比于预测复发性OC的患者。 一个建立了由39个特征基因组成的SVM分类器用于预测OC的复发和预后。 因此,本研究的结果提出了39个特征基因可能在OC和OC的发展中起重要作用,可以代表OC的治疗性生物标志物。

介绍

卵巢癌(OC)是最常诊断的第七位美国女性的癌症和平均五年生存率
为45%。 OC经常治疗后复发。此外,20%的患者与I期和II期癌症经历一次复发。复发密切相关与OC的预后有关,因此,有一项规定─新型生物标志物可以预测OC的复发,改善OC患者的预后。以前的研究已发现许多相关的进展生物标志物。血清白细胞介素水平升高(IL)-37可预测上皮患者预后不良。 Sprouty 2是一种独立的预后生物标志物用于人上皮OC的存活和复发。已经揭示IL-8代表了一种生物标志物复发性铂敏感患者的诊断预测。此外,高尔基体磷蛋白3的上调与上皮细胞癌患者预后有关。 III类β-微管蛋白在肿瘤内过度表达微环境已被证明代表了一种预后生物标志物用于患者的总体生存率差与OC(10)。丝裂原活化蛋白激酶/细胞外据报道,信号调节激酶1代表a有希望的候选预后生物标志物和相关的对铂类化疗的反应率有所提高OC(11)。皮瓣结构特异性核酸内切酶1过表达已被发现与生存率低有关患者表现出高级和晚期OC(12)。在此外,成纤维细胞生长因子18(FGF18)的过度表达是临床结果不佳的独立预测标志物在患有OC的患者中,FGF18已被证明可以调节晚期OC细胞迁移,侵袭和通过核的致瘤性因子-κB激活(13)。肿瘤坏死因子α诱导蛋白质8过表达与上皮OC有关
转移和生存率低,因此可以发挥作用上皮OC的预后和治疗生物标志物(14)。然而,需要具有更高准确度的生物标志物预测OC的复发和预后。在本研究中,来自患者的样本数据三种基因表达数据中的复发和非复发性OC-分析组以鉴定差异表达的基因(DEGS)。在此之后,鉴定了相关的特征基因然后用于建立支持向量机(SVM)分类器,其结果得到进一步验证。本研究的结果建议SVM分类器可以促进预测OC复发和预后

目录
相关文章
|
机器学习/深度学习 数据采集
2D Logistic Regression
2D Logistic Regression 是一种用于解决二分类问题的机器学习模型,它是 Logistic Regression 在多维空间中的扩展。在 2D Logistic Regression 中,我们使用一个二维平面(或多维空间中的超平面)来将不同类别的数据分开。
82 1
|
机器学习/深度学习 数据采集
Logistic Regression
机器学习中的逻辑回归(Logistic Regression)是一种用于解决分类问题的线性模型。它通过拟合一条直线(或平面),将输入变量与输出变量(通常为二值变量,如 0 或 1)之间的关系表示出来。
60 0
|
机器学习/深度学习 数据挖掘 PyTorch
Softmax Classifier 多分类问题
Softmax Classifier 多分类问题
99 0
|
机器学习/深度学习 PyTorch 算法框架/工具
深入理解二分类和多分类CrossEntropy Loss和Focal Loss
多分类交叉熵就是对二分类交叉熵的扩展,在计算公式中和二分类稍微有些许区别,但是还是比较容易理解
1404 0
|
测试技术 计算机视觉
sklearn.model_selection.learning_curve介绍(评估多大的样本量用于训练才能达到最佳效果)
sklearn.model_selection.learning_curve介绍(评估多大的样本量用于训练才能达到最佳效果)
|
机器学习/深度学习 人工智能 数据可视化
分类预测:Bayes Classifier-1|学习笔记(一)
快速学习分类预测:Bayes Classifier-1
分类预测:Bayes Classifier-1|学习笔记(一)
|
数据挖掘 开发者 Python
分类预测:Bayes Classifier-1|学习笔记(二)
快速学习分类预测:Bayes Classifier-1
分类预测:Bayes Classifier-1|学习笔记(二)
|
机器学习/深度学习 人工智能 数据可视化
分类预测:Bayes Classifier-1|学习笔记
快速学习分类预测:Bayes Classifier-1
分类预测:Bayes Classifier-1|学习笔记
|
数据采集 机器学习/深度学习 人工智能
分类预测:Bayes Classifier -2|学习笔记
快速学习分类预测:Bayes Classifier -2
分类预测:Bayes Classifier -2|学习笔记
|
机器学习/深度学习
COVID-19 Cases Prediction (Regression)(一)
COVID-19 Cases Prediction (Regression)
521 0
COVID-19 Cases Prediction (Regression)(一)