略微学习一下二区4.5分纯生信,单基因肺结核叶酸基因集+泛癌分析

简介: 研究摘要:一项发表于2023年《MEDIATORS OF INFLAMMATION》杂志的文章发现,RTP4基因可能成为诊断肺结核的新生物标志物。研究者通过分析GEO数据库中的多个微阵列数据集,使用WGCNA方法识别与肺结核和叶酸生物合成相关的基因模块。RTP4在健康与肺结核患者间的表达有显著差异,并且在抗结核治疗前后表达量变化。泛癌分析显示,RTP4在不同肿瘤类型中的表达与预后关联不一,提示其可能在多种癌症中具有重要功能。这些发现支持RTP4作为诊断工具的潜力,并为进一步研究其在结核病和癌症中的作用奠定了基础。

今天给大家分享一篇IF=4.5的单基因非肿瘤思路的文章,于2023年4月发表在MEDIATORS OF INFLAMMATION上:RTP4, a Biomarker Associated with Diagnosing Pulmonary Tuberculosis and Pan-Cancer Analysis,RTP4, 与肺结核诊断和泛癌相关的生物标志物

image.png

摘要

  • 背景:肺结核(PTB)是一种全球性的传染病流行病;我们研究的目的是探索肺结核诊断的新潜在生物标志物,并进一步用这些标志物进行全癌分析。
  • 方法:我们从GEO公共数据库下载了四个微阵列基因表达数据集进行进一步分析。健康对照(HC)样本和肺结核(PTB)样本在叶酸生物合成途径中的富集得分被计算出来。这些得分被用作新的表型,并与临床信息(对照或PTB)结合进行后续分析。我们使用权重基因共表达网络分析(WGCNA)来寻找与PTB和叶酸生物合成最相关的模块。通过交叉分析GSE28623的绿黄色模块和GSE83456的棕色模块,筛选出了29个共存基因。我们使用蛋白质-蛋白质相互作用网络分析来缩小基因范围,寻找中心基因。然后,我们从UCSC数据库下载统一和标准化的泛癌数据集,用于生物标志物与预后和肿瘤分期差异之间的相关性分析。
  • 结果:最终,RTP4被选为生物标志物。为验证这一生物标志物的可靠性,我们在基因集(GSE28623GSE83456GSE34608)中计算了ROC下的面积(AUC)。最后,为了探讨抗结核治疗前后RTP4表达的差异,我们录入了GSE31348基因集,比较了第0周和第26周的表达。结果显示这两个时间点之间存在显著差异(p < 0.001)。在三个基因集中,与健康对照组相比,肺结核组的RTP4显著上调,而在一个基因集中,抗结核治疗后RTP4下调。这些结果表明RTP4可以作为诊断结核病的潜在生物标志物。泛癌分析的结果显示,RTP4在4种肿瘤类型中的高表达与预后不良呈正相关,而在6种肿瘤类型中的高表达与预后不良呈负相关。我们发现在5种类型的肿瘤中,RTP4基因在不同分期的表达存在显著差异。
  • 结论:RTP4可能是诊断肺结核的新潜在生物标志物。

结果

image.png image.png
图 1. 训练基因集中差异性KEGG途径基因集的富集分析

  • (a) GSE28623: 健康对照组和肺结核组之间的京都基因与基因组百科全书基因集的不同激活水平。绿松色和红色线分别代表对照组和肺结核组。
  • (b) GSF83456:同上

image.png image.png
图 2. 在WGCNA中确定软阈值

  • (a) GSE28623: 分析各种软阈值的无尺度指数和平均连通性
  • (b) GSF83456:同上

image.png image.png
图 3 . 基于不相似度测量(1-TOM)对所有差异表达基因的系统树图

  • (a) GSE28623:通过基于邻接的异性分层聚类获得的基因聚类树
  • (b) GSF83456:同上

image.png image.png
图 4 . 模块相关临床性状热图

  • (a) GSE28623基因集的模块-特征关系。
  • (b) GSF83456:同上

image.png
图 5 . 黄绿色模块(GSE28623)和棕色模块(GSE83456)交集基因

image.png

图 6 . PPI网络和核心网络

image.png

图 7 . RTP4分别在GSE28623、GSE83456和GSE34608中RTP4表达的AUC图

image.png

图 8 . 抗结核病治疗前后RTP4的表达差异(五个时间点)

image.png image.png
图 9、10 . GSE28623和GSE83456中HC组和PTB组之间RTP4的不同表达式。

image.png

图 11 . 正常样本和肿瘤样本之间26种肿瘤中RTP4的不同表达

image.png

图 12 . (A1-A4)GBMLGG、LAMA、LGG和PAAD中RTP4低表达组和高表达组的生存曲线

image.png

图 13 . 39种肿瘤的RTP4基因表达与预后之间的关系

image.png

图 14 . 在5种肿瘤中,RTP4在不同阶段的表达差异

要点

  • 全篇的分析其实并不难,常规的基因集打分,WGCNA然后交集、PPI网络、ROC曲线、组间表达差异箱线、泛癌、生存预后、RTP4的表达差异。只看图就能知道文章的研究思路了。
  • 这篇文章怎么说呢,工作量似乎很多但是有点泛,而且发在特刊,挺多小瑕疵的,例如笔者看了好几遍都没get到这里森林图用的是单因素还是多因素,不过都整理到这了还是分享出来吧。
  • 复现没有什么难度,大家相对看看,可以借鉴但是务必研究深入一点,抬一下工作量,格局打开


目录
相关文章
|
5月前
|
消息中间件 机器学习/深度学习 算法
程序与技术分享:02Prodigal基因预测
程序与技术分享:02Prodigal基因预测
105 2
|
1月前
|
数据采集 数据挖掘 数据库
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
115 0
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
|
3月前
|
机器学习/深度学习 数据可视化 Python
【江西省研究生数学建模竞赛】第三题 植物的多样性 建模方案及参考文献
本文提供了江西省研究生数学建模竞赛第三题“植物的多样性”的建模方案、参考文献和可视化示例,探讨了如何通过数学模型研究植物数量变化规律并提出保持森林多样性的策略。
40 0
【江西省研究生数学建模竞赛】第三题 植物的多样性 建模方案及参考文献
|
3月前
|
机器学习/深度学习 数据挖掘 Python
【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 问题二 时间突变分析 Python实现
第十届“泰迪杯”数据挖掘挑战赛B题中对电力系统负荷预测分析进行时间突变分析的Python实现方法,包括定义绘图函数、应用阈值查找异常值、手动设置阈值、使用分位数和3Sigma原则(IQR)设定阈值,以及根据分位数找到时间突变的步骤,并提供了完整代码的下载链接。
68 0
|
6月前
|
机器学习/深度学习 算法 数据挖掘
JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR
本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。
125 0
|
6月前
|
算法 数据可视化 数据挖掘
JCR一区10.9分|单细胞:有一手数据的肿瘤课题组怎么冲高分文章
这篇文章介绍了在《肿瘤免疫疗法》杂志上发表的一项研究,该研究利用单细胞RNA测序技术揭示了肝细胞癌(HCC)中FABP1(脂肪酸结合蛋白1)依赖的免疫抑制环境。研究分析了II期和III期HCC患者样本的免疫细胞,发现FABP1在III期HCC的肿瘤相关巨噬细胞(TAMs)中过度表达,并与免疫抑制有关。FABP1与PPARG(过氧化物酶体增殖物激活受体伽玛)相互作用,促进了HCC中的脂肪酸氧化,进而影响免疫应答。
93 0
|
6月前
|
数据库
文献速读|毕设不愁了,中科院二区5分非肿瘤双疾病分析思路
研究摘要:一项发表于2023年《Molecular Neurobiology》(IF=5.1)的论文探讨了帕金森病(PD)与重度抑郁症(MDD)的共病基因。研究通过分析基因表达谱数据识别出PD和MDD的共同基因,特别是AQP9、SPI1和RPH3A三个关键基因。这些基因在两种疾病中均表现出显著差异表达,且与中性粒细胞和单核细胞的功能有关。研究使用生物信息学方法进行基因功能注释和蛋白质相互作用网络分析,并通过实验验证了基因在模型系统中的作用,强调了这些基因在疾病病理生理中的潜在角色。
152 0
|
数据库
生信分析|基因组倍型鉴定
生信分析|基因组倍型鉴定
169 0
硕士毕业设计:基于医疗异构信息网络表征学习的病人相似性(聚类分析)
硕士毕业设计:基于医疗异构信息网络表征学习的病人相似性(聚类分析)
57 0
|
机器学习/深度学习 分布式计算 DataWorks
用数据讲故事:十大统计学/机器学习魔法指数
用数据讲故事:十大统计学/机器学习魔法指数
244 0