文献速读|7分的干湿结合胃癌单细胞联合bulk转录组+线粒体自噬

简介: 研究人员通过单细胞和bulk RNA测序,鉴定出18个线粒体自噬相关基因(MRGs),在胃癌中的预后作用。这些基因可能成为新的生物标志物和治疗靶点。分析显示GABARAPL2和CDC37在上皮细胞中高度表达,与免疫浸润和预后相关。构建的风险模型在多个独立队列中验证有效,表明MRGs可改善预后预测,并提示免疫治疗潜力。研究强调了单细胞分析在理解疾病复杂性和指导个性化治疗中的价值。

今天给大家分享一篇IF=7.7的单细胞联合bulk线粒体自噬的文章,于2023年7月发表在Computers in Biology and Medicine上:Identifying mitophagy-related genes as prognostic biomarkers and therapeutic targets of gastric carcinoma by integrated analysis of single-cell and bulk-RNA sequencing data,整合单细胞和blukRNA测序数据鉴定线粒体自噬相关的基因作为胃癌的预后生物标志物和治疗靶点

image.png

摘要

胃癌(GC)是全球癌症相关死亡的第四大原因。晚期胃癌患者往往预后不良,生存期缩短。寻找胃癌预后的新型预测生物标志物是迫切的需求。线粒体自噬是选择性降解受损线粒体以维持细胞稳态的过程,已被证明具有促癌和抗癌效应。本研究结合单细胞测序数据和转录组学来筛选与胃癌进展相关的线粒体自噬相关基因(MRGs)并分析其临床价值。反转录-定量PCR(RT-qPCR)和免疫化学(IHC)进一步验证了基因表达谱。

在取单细胞测序数据和MRGs的交集后,共鉴定出18个差异表达的MRGs。高MRG评分的细胞主要分布在上皮细胞簇中。上皮细胞与其他细胞类型之间的细胞间通信显著上调。我们基于DE-MRGs(GABARAPL2和CDC37)和传统的临床病理参数建立并验证了一个可靠的诺模型。GABARAPL2和CDC37显示出不同的免疫浸润状态。考虑到中心基因与免疫检查点之间的显著相关性,针对胃癌中的MRGs可能会为接受免疫治疗的患者带来更多的益处。总之,GABARAPL2CDC37可能是胃癌的预后生物标志物和候选治疗靶点。

分析流程

image.png

结果

image.png

图 2. 胃癌中的细胞类型分群

  • A. 6个细胞簇的 t-SNE 图。
  • B. 7个胃癌样本中的细胞比例。
  • C. 每个细胞簇中诊断标记基因表达的气泡图。
  • D. 每个细胞簇中诊断标记基因表达的小提琴图。
  • E. 每个细胞簇中前20个基因的热图。

image.png

图 3. 基于单细胞 RNA 测序鉴定差异表达的线粒体自噬相关基因

  • A. 细胞标记与 MRGs 之间的 DE-MRGs 的venn图。
  • B. 18个 DE-MRGs 的相关性分析。
  • C-T. 18个 DE-MRGs 的 t-SNE 图。

image.png

图 4. 18个 DE-MRGs 的评分

  • A. 18个 DE-MRGs 的 AUC 直方图。
  • B. 基于每个细胞的 MRG 评分的 t-SNE 图。
  • C. 高 MRG 评分细胞中的 DEGs 的基因本体论(GO)分析。
  • D. 高 MRG 评分细胞中的 DEGs 的京都基因与基因组百科全书(KEGG)分析。

image.png

图 5. 上皮细胞的细分和轨迹分析

  • A. 胃癌中8个上皮细胞亚群的 t-SNE 图。
  • B. 8个细胞亚群中细胞标记的表达的小提琴图。
  • C-T. 8个细胞亚群中18个 DE-MRGs 的 t-SNE 图。
  • U-W. 上皮细胞的分化轨迹,按状态(U)、细胞类型(V)和拟时间(W)进行着色。

image.png

图 6. 18个 DE-MRGs 在分化假时间轨迹中的相对表达谱
A. ATF4、B. JUN、C. TOMMF7、D. UBA52、E. RPS27A、F. UBB、G. UBC、H. SQSTM1、I. GABARAPL2、J. MAP1LC3B、K. HIF1A、L. BNIP3L、M. FOXO3、N. CITED2、O. RAB7A、P. FIS1、Q. VDAC1、R. CDC37。

image.png

图 7. 细胞间通讯分析

  • A. 细胞间通讯展示交互次数(左)和交互强度(右)。蓝色块表示下调的交互,而红色块代表胃癌中上调的通讯。
  • B. 胃癌中不同细胞类型之间上调的受体-配体交互网络。X轴代表不同的细胞类型,Y轴代表受体-配体对。
  • C. 不同的上皮细胞亚群之间上调的受体-配体交互网络。B-C中的点的大小代表 P 值。红点表示更高的通讯概率,而蓝点代表较低的通讯概率。

image.png

图 8. 基于转录组学鉴定差异表达基因 (DEGs)

  • A. 基于转录组测序结果的正常和肿瘤组间10个 DEGs 的火山图。蓝点表示肿瘤中下调的基因,红点表示肿瘤中上调的基因。
  • B. 基于转录组测序结果的正常和肿瘤组间10个 DEGs 的热图。
  • C. 文氏图显示细胞标记与整体转录组之间有223个重叠的 DEGs。
  • D. 223个 DEGs 的GO分析。

image.png

图 9. 共识聚类分析

  • A. 共识 k = 2 时的聚类热图。
  • B. 不同共识 k 值的累积分布函数 (CDF) 曲线。
  • C. CDF 曲线下的增量面积,表示每个聚类数 (k) 的 CDF 曲线下面积的相对变化。
  • D. 2个簇之间 18 个 DE-MRGs 表达水平的差异。
  • E. 2个簇的主成分分析。
  • F. 2个簇之间的免疫评分比较。
  • G. 由 ssGSEA 计算的 2 个簇之间的免疫浸润评分差异。P < 0.05, P < 0.01, P < 0.001, **P < 0.0001。

image.png

表-1. 胃癌患者的基线特征

image.png

表-2. DE-MRGs 的单变量 Cox 回归分析

image.png

表-3. DE-MRGs 的多变量 Cox 回归分析
image.png

图 10. 预后风险模型的构建和验证

  • A-B. 基于 LASSO 回归分析中获得的最优参数选择预后 DE-MRGs。
  • C. K-M 曲线显示了 TCGA-STAD 队列中两个风险组患者的生存结果。
  • D. 绘制时间相关的 ROC 曲线,以评估 TCGA-STAD 队列中1年、3年和5年的生存率。
  • E. K-M 曲线显示了 GSE62254 队列中两个风险组患者的生存结果。
  • F. 绘制时间相关的 ROC 曲线,以评估 GSE62254 队列中1年、3年和5年的生存率。
  • G. K-M 曲线显示了 GSE15459 队列中两个风险组患者的生存结果。
  • H. 绘制时间相关的 ROC 曲线,以评估 GSE15459 队列中1年、3年和5年的生存率。
  • I-J. TCGA 队列中风险评分和相关临床特征的单变量和多变量 cox 回归分析。
  • K. 用包括 GABARAPL2、CDC37、年龄和阶段等不同因子构建了 nomogram。
  • L. 使用校准曲线评估此 nomogram 预测3年生存的预后准确性。

image.png

图 11. 免疫浸润分析

  • A. 31对胃癌组织及其相邻组织中 GABARAPL2 和 CDC37 的相对mRNA表达水平。
  • B. 通过免疫组化检测胃癌组织中 GABARAPL2 和 CDC37 的蛋白表达水平。
  • C. K-M 曲线显示 GABARAPL2 和 CDC37 不同表达下的生存结果。
  • D. GABARAPL2 与免疫细胞之间的相关性分析。
  • E. CDC37 与免疫细胞之间的相关性分析。
  • F. 免疫评分与免疫细胞之间的相关性分析。
  • G. 高风险和低风险组之间的免疫浸润差异。
  • H. 核心基因(GABARAPL2 和 CDC37)与免疫检查点之间的相关性分析。在 A-C 中,绿点表示 P < 0.05;黄点表示 P < 0.01;灰点表示 P > 0.05。在 E 中,P < 0.05, P < 0.01, P < 0.001。

image.png

图 12. 基因突变分析

  • A. 瀑布图显示高风险组中的体细胞突变 (N = 174)。
  • B. 瀑布图显示低风险组中的体细胞突变 (N = 179)。
  • C. 高风险和低风险组之间肿瘤突变负担 (TMB) 的差异。
  • D. K-M 曲线显示 TMB-高 和 TMB-低 组患者的生存结果。
  • E. 高风险组中的拷贝数变异分析。红线表示扩增突变,蓝线表示缺失突变。
  • F. 低风险组中的拷贝数变异分析。红线表示扩增突变,蓝线表示缺失突变。
  • G. MSI 和 TMB 之间的相关性分析。
  • H. TIDE 和排斥之间的相关性分析。
  • I. MSI 和功能障碍之间的相关性分析。
  • J. TIDE 和功能障碍之间的相关性分析。

要点

  • 整篇分析下来,逻辑性非常强,结合单细胞和转录组数据来筛选与GC进展相关MRGs,共识聚类、预后模型、免疫浸润,最后通过RT-qPCR和免疫组化方法验证了基因表达谱。
  • 每个板块有条有理,这样严谨的研究思路笔者觉得可以投个9分的期刊了,作为7分的干湿结合生信文章有过之无不及,想进阶的小伙伴可以复现一波。
目录
相关文章
|
7月前
|
算法 数据挖掘 Go
文献速读|5分生信+免疫组化单细胞联合bulk转录组肿瘤预后模型
研究摘要: 在《Cancer Immunology Immunotherapy》上发表的一篇文章,通过整合Bulk和单细胞RNA-seq数据,探讨了非小细胞肺癌(NSCLC)中癌相关纤维细胞(CAF)的作用。研究者识别出CAF的预后标志物,构建了一个基于CAF的模型,该模型在四个独立队列中区分了预后良好的和较差的患者。WGCNA分析鉴定出CAF标记基因,而CAF分数与免疫微环境和免疫治疗反应相关。高CAF分数关联较差的免疫治疗反应,FBLIM1被发现为CAF的主要来源,其高表达预测了免疫疗法的不良反应。该研究揭示了CAF在NSCLC免疫抑制和治疗策略中的重要地位。
188 1
|
7月前
|
计算机视觉
【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割
【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割
51 0
|
3月前
|
存储 数据挖掘
单细胞|线粒体基因型和DNA可及性联合分析
单细胞|线粒体基因型和DNA可及性联合分析
92 15
单细胞|线粒体基因型和DNA可及性联合分析
|
6月前
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
352 3
|
数据挖掘 Go 计算机视觉
文献丨群体转录组分析eQTLs调控基因表达
文献丨群体转录组分析eQTLs调控基因表达
|
7月前
|
机器学习/深度学习 算法 数据挖掘
JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR
本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。
143 0
|
7月前
|
机器学习/深度学习 弹性计算 数据可视化
玩ST、肿瘤研究的来学习一下!16分Nature子刊的单细胞空间转录组+机器学习
Nature Communications 发表了一项关于空间转录组和机器学习在肿瘤研究中的应用。研究聚焦于HPV阴性口腔鳞状细胞癌,通过整合单细胞和空间转录组分析,揭示了肿瘤核心(TC)和前沿边缘(LE)的独特转录特征。TC和LE的基因表达模式与多种癌症的预后相关,其中LE基因标志关联不良预后,而TC则与较好预后相关。利用机器学习,研究人员建立了预测模型,识别出跨癌症类型的保守TC和LE特征。此外,他们还分析了RNA剪接动态,发现了潜在的治疗脆弱性。这项工作为肿瘤生物学和靶向治疗提供了新见解,并为药物开发提供了依据。
108 0
|
7月前
|
机器学习/深度学习 文字识别 数据挖掘
文献速读|别人家的孟德尔随机化,全基因组纯生信30分Nature子刊
Nature Genetics上的一篇高影响力(IF=30.8)文章利用孟德尔随机化分析了暴食症(BED)的遗传基础。研究通过机器学习预测个体患BED概率,进行全基因组关联研究,识别了与铁代谢相关的基因位点,如HFE、MCHR2、LRP11及APOE。这些发现揭示了BED的遗传信号与铁代谢的关联,为理解这种疾病的病理生理学提供了新见解,并为治疗研究指明方向。文章中还包括多个图表展示分析结果。读者可以通过后台回复特定代码获取文献。
169 0
|
编解码 芯片
文献丨转录组RNA seq——青年阶段!(下)
文献丨转录组RNA seq——青年阶段!(下)
|
数据挖掘
文献丨转录组RNA seq——青年阶段!(上)
文献丨转录组RNA seq——青年阶段!
文献丨转录组RNA seq——青年阶段!(上)
下一篇
DataWorks