文献速读|毕设不愁了,中科院二区5分非肿瘤双疾病分析思路

简介: 研究摘要:一项发表于2023年《Molecular Neurobiology》(IF=5.1)的论文探讨了帕金森病(PD)与重度抑郁症(MDD)的共病基因。研究通过分析基因表达谱数据识别出PD和MDD的共同基因,特别是AQP9、SPI1和RPH3A三个关键基因。这些基因在两种疾病中均表现出显著差异表达,且与中性粒细胞和单核细胞的功能有关。研究使用生物信息学方法进行基因功能注释和蛋白质相互作用网络分析,并通过实验验证了基因在模型系统中的作用,强调了这些基因在疾病病理生理中的潜在角色。

今天给大家分享一篇IF=5.1的帕金森和抑郁症共病模型的文章,于2023年7月发表在Molecular Neurobiology上:Identification and Experimental Validation of Parkinson’s Disease with Major Depressive Disorder Common Genes,帕金森与重度抑郁症共病基因的鉴定与实验验证

image.png

摘要

帕金森病(PD)是一种常见的神经退行性疾病,经常伴有非运动症状如重度抑郁症(MDD)。但MDD在PD中的病理生理机制尚不清楚。本研究旨在探索PD与MDD的关联基因及其分子机制。研究者从基因表达谱数据库下载了PD和MDD的基因数据,并通过差异表达基因(DEGs)分析找到了两者的共同基因。通过多种生物信息学方法,如基因本体论、京都基因与基因组百科全书分析和蛋白质-蛋白质相互作用网络,研究者识别出了三个关键基因:AQP9SPI1RPH3A。这三个基因在PD和MDD中都有明显的差异表达。结果还显示,中性粒细胞和单核细胞在PD和MDD的进程中起关键作用。

分析流程

image.png

结果

image.png

图 2. 原始和标准化的表达矩阵

  • GSE6613和GSE98793数据集的箱线图(A-D)
  • 主成分分析图(E-F)。PCA,即主成分分析

image.png

图 3. 两个数据集中基因的表达和差异表达基因的识别

  • A GSE6613中差异性DEGs的火山图。设定的阈值为|log2FC(倍数变化)|>0,且p值<0.05。
  • B, C PD数据集中同时上调的前50名DEGs和同时下调的前50名DEGs。
  • D GSE98793中的差异性DEGs火山图。设定的阈值为|log2FC(倍数变化)|>0.585,且p值<0.05。
  • E–F MDD数据集中同时上调的前50名DEGs和同时下调的前50名DEGs。

image.png

图 4. 共病DEGs的识别

  • A 通过venn图表示PD数据集和MDD数据集的交叉DEGs。
  • B, C GSE6613和GSE98793中具有相同趋势的共病DEGs的热图。

image.png

图 5. 在Lasso模型中筛选候选基因

  • A, B 通过基因数目(n=8)最佳地表示了PD伴MDD的诊断,这些基因对应于曲线的最低点。
  • C 多变量Cox回归分析显示,这个预后模型是PD的一个独立预后参数。
  • D 热图显示了基于风险评分的八个基因的表达。


image.png

图 6. 候选基因的验证

  • A, E GSE99039和GSE201332中重要中心基因的表达水平。
  • B-D 通过ROC曲线评估中心基因对PD(B, C)或MDD(D, F)的诊断准确性。

image.png

图 7. MPTP和CUMS模型的验证

  • A C57Bl/6小鼠经腹腔注射MPTP进行处理。通过免疫组织化学确定SNpc TH阳性神经元的数量。刻度条=500 μm。n=6。
  • B 代表强迫游泳测试中的不动、攀爬和游泳时间的数据。


image.png

图 8. 核心基因的验证

  • A AQP9、RPH3A 和 SPI1 的相对mRNA水平。(p<0.01, *p<0.001, p<0.0001)。

image.png

图 9. 与临床特征的相关性分析

  • A–D AQP9的表达水平(UPDRS I-IV)。
  • E–H RPH3A的表达水平(UPDRS I-IV)。
  • I–L SPI1的表达水平(UPDRS I-IV)。

image.png

图 10. 基因集富集分析

  • A–C 这些图显示了在GSE6613中的APQ9、RPH3A和SPI1基因集的富集得分和基因集。
  • D–F 这些图显示了在GSE98793中的APQ9、RPH3A和SPI1基因集的富集得分和基因集。

image.png

图 11. PPI网络和TF-基因交互网络

  • A 使用GeneMANIA数据库分析了中心基因的基因-基因交互网络。显示了20个变化最频繁的邻近基因。
  • B 红色节点代表高可信度的候选基因,绿色节点在TF-基因交互网络中代表TF基因。

image.png

图 12. GSE6613和GSE98793的免疫浸润分析

  • A, B GSE6613和GSE98793每个样本的免疫细胞浸润图。
  • C, D GSE6613和GSE98793的22种免疫细胞浸润的相关性热图。p<0.05, p<0.01, p<0.001, p<0.0001。
  • E–F 箱线图展示了GSE6613和GSE98793的22种免疫细胞的比较。

要点

  • 中规中矩的非肿瘤分析思路,差异分析、交集、通路富集、PPI网络、免疫浸润、LASSO回归筛选核心基因、qPCR、还有MPTPCUMS这两个研究神经退行性疾病和抑郁症常用模型。
  • 双疾病分别各两个数据集,一个分析一个外部验证,外加一个实验验证,Q1中科院二区,整体生信部分的分析都算入门级了,这样的研究思路值得参考一下,感兴趣的小伙伴可以复现一波。


目录
相关文章
|
机器学习/深度学习 Go 数据库
中科院二区7.7分的纯生信|还是铁死亡,还是肿瘤预后模型
该研究发表在2023年8月的《Computers in Biology and Medicine》杂志上,构建了一个基于铁死亡基因的乳腺癌预后模型。研究发现11个与乳腺癌生存相关的基因,建立了预测模型,并通过TCGA和GEO数据集验证。模型显示良好预测能力,揭示了铁死亡在乳腺癌中的关键角色,特别是JUN基因。此外,还鉴别出10个潜在的免疫治疗靶点,为乳腺癌治疗提供了新方向。
357 2
|
数据可视化 数据挖掘
Seurat 中的数据可视化方法
Seurat 中的数据可视化方法
|
机器学习/深度学习 Windows
解决R语言出现“二进列运算符中有非数值参数”的错误!
解决R语言出现“二进列运算符中有非数值参数”的错误!
2713 0
解决R语言出现“二进列运算符中有非数值参数”的错误!
|
机器学习/深度学习 人工智能 算法
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
随着高通量测序技术的飞速发展和多组学分析的广泛应用,科研人员在探索生物学奥秘时经常遇到一个令人又爱又恼的问题:如何从浩如烟海的数据中挖掘出潜在的疾病关联靶点?又如何构建一个全面而有效的诊断或预后模型?只有通过优雅的数据挖掘、精致的结果展示、深入的讨论分析,并且辅以充分的湿实验验证,我们才能锻造出一篇兼具深度与广度的“干湿结合”佳作。
1497 0
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与未来医疗:AI技术在疾病诊断中的应用前景####
本文探讨了人工智能(AI)在现代医疗领域,尤其是疾病诊断方面的应用潜力和前景。随着技术的不断进步,AI正逐渐改变传统医疗模式,提高诊断的准确性和效率。通过分析当前的技术趋势、具体案例以及面临的挑战,本文旨在为读者提供一个全面的视角,理解AI如何塑造未来医疗的面貌。 ####
|
边缘计算 监控 安全
边缘计算与智能家居
**边缘计算驱动智能家居变革** 边缘计算在智能家居中扮演关键角色,通过本地处理数据,减少延迟,提升设备响应速度。它增强了联网稳定性,实现实时监控,并保护用户隐私。应用实例包括安防系统,智能摄像头可在本地分析视频,检测异常;能源管理系统则通过本地分析优化能源使用。边缘计算预示着智能家居更高效、安全的未来。
|
人工智能
AI生图美学在淘宝的实践应用(2)
AI生图美学在淘宝的实践应用
553 8
|
存储 搜索推荐 应用服务中间件
深入探索Docker 安装 Tomcat
【8月更文挑战第26天】
235 4
|
机器学习/深度学习 人工智能 安全
SentinelOne监测中隔离的文件,人工如何取消隔离
SentinelOne 的 Agent 在终端设备上实时监测系统的活动,包括文件操作、网络通信、内存访问等, SentinelOne 使用人工智能和机器学习技术对监测到的活动进行行为分析,识别潜在的威胁,包括已知的恶意软件和未知的零日攻击。 基于行为分析和实时监测,SentinelOne 快速识别出可能的威胁,并进行准确的威胁分类,包括病毒、勒索软件、恶意脚本等。 SentinelOne 可以自动采取响应措施,如隔离受感染的设备、终止恶意进程、删除恶意文件等,以尽快减轻威胁带来的影响。当技术人员发现隔离的文件没有危害时,可以手动隔离。文章阐述了怎么手动撤销的过程。
1828 0
SentinelOne监测中隔离的文件,人工如何取消隔离
|
数据可视化 数据挖掘
Seaborn中的关系图:探索变量之间的关联
【4月更文挑战第17天】Seaborn库助力探索变量间关联,提供散点图、箱形图、条形图、计数图、热力图和相关图等工具。散点图用于连续变量关系,箱形图展示数值变量分布,条形图对比类别与数值变量,计数图显示类别频率,热力图揭示两类变量交叉表,相关图则呈现多变量两两相关性。选择合适图表能提升数据分析效果。