今天给大家分享一篇IF=7.7
的非肿瘤的文章,2023年7月发表在Computers in Biology and Medicine:Identifying mitophagy-related genes as prognostic biomarkers and therapeutic targets of gastric carcinoma by integrated analysis of single-cell and bulk-RNA sequencing data,通过单细胞和Bulk RNA 测序数据的综合分析,鉴定线粒体自噬相关基因作为胃癌的预后生物标志物和治疗靶点
摘要
胃癌(GC
)是全球癌症相关死亡的第四大原因。晚期GC患者往往预后较差,生存期较短。迫切需要寻找新的GC预后预测生物标志物。线粒体自噬是选择性降解受损线粒体以维持细胞稳态,已被证明具有促肿瘤和抗肿瘤作用。本研究结合单细胞测序数据和转录组学来筛选与GC进展相关的线粒体自噬相关基因(MRG
)并分析其临床价值。逆转录定量PCR(RT-qPCR
)和免疫化学(IHC
)进一步验证了基因表达谱。将单细胞测序数据与 MRG 进行交叉后,总共鉴定出了 18 个 DE-MRG。MRG评分较高的细胞主要分布在上皮细胞簇中。上皮细胞与其他细胞类型之间的细胞间通讯显着上调。我们建立并验证了基于 DE-MRG(GABARAPL2
和 CDC37
)和传统临床病理参数的可靠列线图模型。GABARAPL2和CDC37表现出不同的免疫浸润状态。鉴于中枢基因和免疫检查点之间的显着相关性,针对GC中的MRG可能会给接受免疫治疗的患者带来更多益处。总之,GABARAPL2和CDC37可能是GC的预后生物标志物和候选治疗靶点。
分析流程
结果
图2. GC 中的细胞类型分类。
- A.6 个细胞簇的 t-SNE 图。
- B.7 个 GC 样品中的细胞比例。
- C.每个细胞簇中诊断标记基因表达的气泡图。
- D.每个细胞簇中诊断标记基因表达的小提琴图。
- E.每个细胞簇中前 20 个基因的热图。
图3. 基于单细胞RNA测序鉴定差异表达的线粒体自噬相关基因。
- A. 细胞标记物和 MRG 之间的 DE-MRG 的维恩图分析。
- B. 18 个 DE-MRG 的相关分析。
- C~T.18 个 DE-MRG 的 t-SNE 图。
图4 . 18 个 DE-MRG 的评分。
- A. 18 个 DE-MRG 的 AUC 直方图。
- B. 基于每个细胞的 MRG 评分的 t-SNE 图。
- C. 对具有高 MRG 分数的细胞中的 DEG 进行基因本体 (GO) 分析。
- D. 对具有高 MRG 评分的细胞中的 DEG 进行京都基因和基因组百科全书 (KEGG) 分析。
图5.上皮细胞的细分和轨迹分析。
- A. GC 中 8 个上皮细胞亚群的 t-SNE 图。
- B. 8 个细胞亚群中细胞标记表达的小提琴图。
- C~T. 8 个细胞亚群中 18 个 DE-MRG 的 t-SNE 图。
- U-W. 上皮细胞的分化轨迹,用颜色表示状态 (U)、细胞类型 (V) 和假时间 (W)。
图6 . 分化伪时间轨迹期间 18 个 DE-MRG 的相对表达谱。
- A~R. 18个 DE-MRG的表达
图7 . 细胞间通讯分析。
- A. 细胞间通信显示相互作用数量(左)和相互作用强度(右)。蓝色块表示 GC 中相互作用下调,而红色块表示上调通信。
- B. GC 中不同细胞类型之间的受体-配体相互作用网络上调。X 轴代表不同的细胞类型,Y 轴代表受体-配体对。
- C. 不同上皮细胞亚群之间的受体-配体相互作用网络上调。B–C 中点的大小代表 P 值。红点表示通信概率较高,蓝点表示通信概率较低。
图8 . 基于转录组学的差异表达基因(DEG)鉴定。
- A. 根据转录组测序结果绘制正常组和肿瘤组之间 10 DEG 的火山图。蓝点代表肿瘤中下调的基因,红点代表肿瘤中上调的基因。
- B. 根据转录组测序结果绘制正常组和肿瘤组之间 10 个 DEG 的热图。
- C. 维恩图显示细胞标记物和 Bulk 转录组之间有 223 个交集 DEG。
- D . 223个DEG的GO分析。
图9 . 共识聚类分析。
- A. 共识 k = 2 时的聚类热图。
- B. 不同共识 k 值的累积分布函数 (CDF) 曲线。
- C. CDF 曲线下面积的 Delta 表示每个聚类数 (k) 的 CDF 曲线下面积的相对变化。
- D. 2 个簇之间 18 个 DE-MRG 表达水平的差异。
- E. 2 个簇的主成分分析。
- F. 2 个簇之间的免疫评分比较箱线图。
- G. 通过 ssGSEA 计算的 2 个簇之间的免疫浸润评分差异。
图10。预后风险模型的构建和验证。
- AB. 在 LASSO 回归分析中获得的基于最优参数的预后 DE-MRG 选择。
- C. KM 曲线显示了 TCGA-STAD 队列中两个风险组患者的生存结果。
- D. 绘制时间依赖性 ROC 曲线来评估 TCGA-STAD 队列的 1 年、3 年和 5 年生存率。
- E. KM 曲线显示了 GSE62254 队列中两个风险组患者的生存结果。
- F. 绘制时间依赖性 ROC 曲线来评估 GSE62254 队列的 1 年、3 年和 5 年生存率。
- G. KM 曲线显示了 GSE15459 队列中两个风险组患者的生存结果。
- H. 绘制时间依赖性 ROC 曲线来评估 GSE15459 队列的 1 年、3 年和 5 年生存率。
- I. TCGA 队列中风险评分和相关临床特征的单变量和多变量cox 回归分析。
- K. 该列线图是使用不同因素构建的,包括 GABARAPL2、CDC37、年龄和阶段。
- L. 使用校准曲线来评估该列线图预测 3 年生存率的预后准确性。
图11.免疫浸润分析
- A. 31对GC组织及癌旁组织中GABARAPL2和CDC37的相对mRNA表达水平。
- B.免疫组化检测GC组织中GABARAPL2和CDC37蛋白表达水平。
- C. KM 曲线显示 GABARAPL2 和 CDC37 不同表达的不同生存结果。
- D. GABARAPL2与免疫细胞的相关性分析。
- E. CDC37与免疫细胞的相关性分析。
- F. 免疫评分与免疫细胞之间的相关性分析。
- G. 高危组和低危组之间免疫浸润的差异。
- H. hub基因(GABARAPL2和CDC37)与免疫检查点之间的相关性分析。
图12. 基因突变分析
- A. 显示高危组体细胞突变的瀑布图 (N = 174)。
- B. 显示低风险组体细胞突变的瀑布图 (N = 179)。
- C. 高风险组和低风险组之间肿瘤突变负荷(TMB)的差异。
- D. KM 曲线显示了 TMB 高组和 TMB 低组患者的生存结果。
- E. 高危人群拷贝数变异分析。红线代表扩增突变,蓝线代表缺失突变。
- F. 低风险组的拷贝数变异分析。红线代表扩增突变,蓝线代表缺失突变。格。MSI与TMB之间的相关性分析。
- H. TIDE与排除之间的相关性分析。
- I. MSI与功能障碍之间的相关性分析。
- J. TIDE与功能障碍的相关性分析。
小总结
- 捋一捋:单细胞降维聚类,交集线粒体自噬基因,然后用AUCell评分做了GO和KEGG,再注释亚群对上皮细胞做了拟时序分析,细胞通讯。TCGA的bulkRNAseq差异分析,得到10个MRGs,一致性聚类分为两簇,免疫浸润分析,单因素多因素cox随后lasso回归筛选到两个基,列线模型和5年生存预测,免疫组化,单基因的免疫浸润相关性,最后是基因突变分析。
- 整篇下来,分析方法是没有问题的,很典型的单细胞联合bulkRNA的研究思路,值得学习。但是逻辑上是似乎差了点味,怯许笔者学艺不精,
感觉是部分分析没有衔接起来,会有点跳
。比如scRNA里一直强调的上皮细胞,或者是bulkRNA中cox回归后是5个,笔者看lasso的结果也是5个,但为何又选取了2个基因深入研究,在讨论中也未点明。。。不过,也算无伤大雅,属于是,可参考借鉴学习。