JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR

简介: 本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。

今天给大家分享一篇IF=5.4的非肿瘤机器学习的文章,2023年9月发表在Journal of Endocrinological Investigation:Identification of novel characteristic biomarkers and immune infiltration profile for the anaplastic thyroid cancer via machine learning algorithms,通过机器学习算法识别再生障碍性甲状腺癌的新特征生物标志物和免疫浸润

image.png

摘要

  • 目的:间变性甲状腺癌(ATC)是一种罕见且致命的恶性癌症。近年来,分子驱动的靶向治疗和免疫疗法的应用显著改善了ATC的预后。本研究旨在识别ATC诊断的特征基因,并揭示ATC特征基因在药物敏感性和免疫细胞浸润中的作用。
  • 方法:我们从GEO数据库下载了ATC的RNA测序数据。在合并和标准化数据集后,我们首先将合并的数据集分为训练队列和验证队列。我们通过在训练队列中进行差异表达分析来识别ATC的差异表达基因(DEGs)。我们使用两种机器学习算法,最小绝对收缩和选择算子(LASSO)以及支持向量机递归特征消除(SVM-RFE)来识别ATC的特征基因。我们使用CIBERSORT算法来计算ATC中各种免疫细胞的丰度。最后,我们通过定量逆转录聚合酶链反应(RT-qPCR)验证了ATC特征基因在ATC细胞系和免疫组织化学(IHC)中的表达。
  • 结果:在训练队列中共鉴定出425个DEGs,包括240个上调基因和185个下调基因。我们识别出了4个ATC特征基因(ADM、PXDN、MMP1和TFF3),并在验证队列中验证了它们的诊断价值(ROC分析中的AUC>0.75)。我们建立了一个基于基因表达的实用性判分模型,可以准确预测ATC的发病概率。我们还发现,ATC特征生物标志物与肿瘤免疫微环境和药物敏感性有关。
  • 结论:ADM、PXDN、MMP1TFF3可能作为潜在的ATC诊断生物标志物,并可能有助于ATC的分子靶向治疗和免疫疗法。

分析流程

image.png

结果

image.png

图2 数据处理和差异基因(DEGs)鉴定。

  • A 去除批次效应前的主成分分析(PCA)。
  • B 去除批次效应后的主成分分析(PCA)。
  • C 差异基因的热图。
  • D 差异基因的火山图,红色点表示上调基因,绿色点表示下调基因。

image.png


图3 基于差异基因(DEGs)的综合功能富集分析。

  • A 上调DEGs的GO富集分析。
  • B 下调DEGs的GO富集分析。
  • C 上调DEGs的KEGG通路富集分析。
  • D 下调DEGs的KEGG通路富集分析。
  • E ATC和非恶性之间的GSVA分析。上调基因集中的虚线表示GSVA富集分数=1,下调基因集中的虚线表示GSVA富集分数= -1。

image.png

图4 对训练队列中的ATC患者进行一致性聚类分析

  • A 两个ATC亚型的一致性聚类矩阵。
  • B ATC亚型的PCA分布图。
  • C 差异通路的火山图。
  • D 差异通路的热图。

image.png

图5 在ATC训练队列中识别特征生物标志物

  • A 使用LASSO回归算法筛选ATC的特征生物标志物。
  • B 使用基于SVM-RFE的机器学习算法识别ATC的特征生物标志物。
  • C LASSO回归算法和SVM-RFE算法之间的交集基因。
  • D-G 箱线图验证训练队列中特征基因的表达水平。“Con”指的是非恶性样本。
  • H-K ROC曲线评估训练队列中特征基因的诊断准确性。


图6 在ATC验证队列中验证特征生物标志物

  • A-D 箱线图验证验证队列中特征基因的表达水平。“Con”指的是非恶性样本。
  • E-H ROC曲线评估验证队列中特征基因的诊断准确性。


图7 预测模型和药物敏感性分析

  • A 用于预测ATC患病概率的预测模型。
  • B 预测模型的校准曲线。
  • C-K 具有特征基因的化疗和靶向治疗药物的估计IC50值。


图8 ATC患者的免疫细胞比例及其与特征生物标志物表达的相关性。

  • A 非恶性甲状腺和ATC样本中免疫细胞浸润的景观。
  • B ADM表达水平与浸润的免疫细胞之间的关系。
  • C MMP1表达水平与浸润的免疫细胞之间的相关性。
  • D PXDN表达水平与浸润的免疫细胞之间的相关性。
  • E TFF3表达水平与浸润的免疫细胞之间的关系。

image.png

图9 特征基因的RT-qPCR和免疫组织化学(IHC)分析

  • A ADM B PXDN C MMP1;(ns:不显著, p<0.05, p<0.01, p<0.001)。
  • D TFF3、PXDN、MMP1的IHC分析。

小总结

  • 这个应该不用过多介绍了,非常典型的干湿结合:合并数据集,差异分析,通路富集,一致性聚类,组间通路富集,LASSO和SVM-RFE筛选靶点,表达表征,列线图,药物敏感性分析,免疫浸润,qPCR和免疫组化。
  • 这个分析路线不算难,适合入门生信想做非肿瘤的小伙伴,提供一个有条有序的研究思路,然后再深入挖掘,“难度不大,预算不高”的标准作~


目录
相关文章
|
1月前
|
算法 数据挖掘 Go
文献速读|5分生信+免疫组化单细胞联合bulk转录组肿瘤预后模型
研究摘要: 在《Cancer Immunology Immunotherapy》上发表的一篇文章,通过整合Bulk和单细胞RNA-seq数据,探讨了非小细胞肺癌(NSCLC)中癌相关纤维细胞(CAF)的作用。研究者识别出CAF的预后标志物,构建了一个基于CAF的模型,该模型在四个独立队列中区分了预后良好的和较差的患者。WGCNA分析鉴定出CAF标记基因,而CAF分数与免疫微环境和免疫治疗反应相关。高CAF分数关联较差的免疫治疗反应,FBLIM1被发现为CAF的主要来源,其高表达预测了免疫疗法的不良反应。该研究揭示了CAF在NSCLC免疫抑制和治疗策略中的重要地位。
81 1
|
21天前
|
Web App开发 算法 数据挖掘
JCR一区7.3分|内质网应激+分型+药物筛选分子对接
这篇研究分析了溃疡性结肠炎(UC)内质网应激相关基因特征,发表在《Frontiers in Immunology》杂志上。通过基因表达谱和加权基因共表达网络分析,研究人员识别出915个差异表达基因和11个关键的内质网应激相关基因(ERSRGs),这些基因在UC中具有诊断价值。他们还发现诺斯卡品作为小分子药物,可能通过影响ERS对UC产生治疗潜力。此外,研究揭示了ERS在UC发病机制中的重要角色,并与免疫细胞浸润和结肠粘膜侵袭相关。通过一致性聚类,确定了ERS相关的亚型,这些发现为理解UC的病理机制和潜在治疗提供了新见解。
19 0
|
21天前
|
算法 数据可视化 数据挖掘
JCR一区10.9分|单细胞:有一手数据的肿瘤课题组怎么冲高分文章
这篇文章介绍了在《肿瘤免疫疗法》杂志上发表的一项研究,该研究利用单细胞RNA测序技术揭示了肝细胞癌(HCC)中FABP1(脂肪酸结合蛋白1)依赖的免疫抑制环境。研究分析了II期和III期HCC患者样本的免疫细胞,发现FABP1在III期HCC的肿瘤相关巨噬细胞(TAMs)中过度表达,并与免疫抑制有关。FABP1与PPARG(过氧化物酶体增殖物激活受体伽玛)相互作用,促进了HCC中的脂肪酸氧化,进而影响免疫应答。
29 0
|
29天前
|
机器学习/深度学习 弹性计算 数据可视化
玩ST、肿瘤研究的来学习一下!16分Nature子刊的单细胞空间转录组+机器学习
Nature Communications 发表了一项关于空间转录组和机器学习在肿瘤研究中的应用。研究聚焦于HPV阴性口腔鳞状细胞癌,通过整合单细胞和空间转录组分析,揭示了肿瘤核心(TC)和前沿边缘(LE)的独特转录特征。TC和LE的基因表达模式与多种癌症的预后相关,其中LE基因标志关联不良预后,而TC则与较好预后相关。利用机器学习,研究人员建立了预测模型,识别出跨癌症类型的保守TC和LE特征。此外,他们还分析了RNA剪接动态,发现了潜在的治疗脆弱性。这项工作为肿瘤生物学和靶向治疗提供了新见解,并为药物开发提供了依据。
26 0
|
29天前
|
机器学习/深度学习 算法 搜索推荐
JCR一区7分线粒体基因,纯生信非肿瘤分型诊断模型
**摘要:** 一项研究在《翻译医学杂志》(IF 7.4)上发表,揭示了线粒体分子特性如何影响风湿性关节炎(RA)的治疗。通过对线粒体基因的分析,研究人员识别出RA患者的三个亚型,每个亚型具有独特的分子和细胞特征。亚型关联分析显示,亚型C对特定生物制剂如英夫利昔单抗、抗TNF药物、利妥昔单抗和甲氨蝶呤/阿巴西普的响应更强。利用机器学习建立了基于线粒体基因的诊断模型,该模型在区分RA亚型上表现优异,为患者分层和个性化治疗提供了新策略。
20 0
|
3月前
|
机器学习/深度学习 计算机视觉
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
20 0
|
10月前
|
机器学习/深度学习 算法 知识图谱
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
142 0
|
11月前
|
机器学习/深度学习 编解码
Nature子刊 | 谭济民、夏波等提出基因组构象预测模型及高通量计算遗传筛选方法
Nature子刊 | 谭济民、夏波等提出基因组构象预测模型及高通量计算遗传筛选方法
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型(1)
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型
127 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型(2)
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型
110 0

热门文章

最新文章