文献速读|5分生信+免疫组化单细胞联合bulk转录组肿瘤预后模型

简介: 研究摘要: 在《Cancer Immunology Immunotherapy》上发表的一篇文章,通过整合Bulk和单细胞RNA-seq数据,探讨了非小细胞肺癌(NSCLC)中癌相关纤维细胞(CAF)的作用。研究者识别出CAF的预后标志物,构建了一个基于CAF的模型,该模型在四个独立队列中区分了预后良好的和较差的患者。WGCNA分析鉴定出CAF标记基因,而CAF分数与免疫微环境和免疫治疗反应相关。高CAF分数关联较差的免疫治疗反应,FBLIM1被发现为CAF的主要来源,其高表达预测了免疫疗法的不良反应。该研究揭示了CAF在NSCLC免疫抑制和治疗策略中的重要地位。

今天给大家分享一篇IF=5.8的纯生信单细胞联合Bulk转录组构建预后模型的文章,于2023年3月19日发表在Cancer Immunology Immunotherapy上:Integrative analyses of bulk and single-cell RNA-seq identified cancer-associated fibroblasts-related signature as a prognostic factor for immunotherapy in NSCLC,联合Bulk和scRNA-seq鉴别NSCLC免疫治疗的癌症相关成纤维细胞预后标志物

image.png

摘要

这项研究的背景是关于肺癌中的癌相关纤维细胞 (Cancer-associated fibroblast,简称CAF)。现代的观点认为CAF在肿瘤生成和肿瘤微环境中的免疫抑制中都扮演了至关重要的角色。然而,对于非小细胞肺癌 (Non-small cell lung cancer,简称NSCLC) 中CAF的临床意义和生物功能,目前仍然探索不足。

通过综合分析大量和单细胞的基因组、转录组和蛋白质组数据,研究者们希望确定NSCLC的CAF相关特征。利用权重基因共表达网络分析 (Weighted gene co-expression network analysis,简称WGCNA) 中确定的CAF标记基因,研究者构建并验证了一个基于CAF的风险模型,该模型可以将患者从四个独立的NSCLC队列中分为两个预后组。

总体上,这项研究致力于揭示CAF在非小细胞肺癌中的角色,并希望找到新的治疗目标或预后标记。

分析流程

image.png

结果

image.png

图 2 利用WGCNA分析在非小细胞肺癌中鉴定癌相关纤维细胞 (CAF) 的标记基因

  • a. 描述了共识网络模块与使用EPIC, MCP-counter和xCell算法计算的CAF渗透之间的相关性。
  • b-d. 描述了红色模块成员资格与EPIC (b)、MCP-counter (c) 和xCell (d) -CAFs的基因重要性之间的皮尔逊相关系数。
  • e-f. 展示了红色模块中基因的基因本体 (e) 和通路 (f) 富集分析。

image.png

图 3 构建并验证非小细胞肺癌 (NSCLC) 的癌相关纤维细胞 (CAF) 预后标志

  • a, d, g. 描述了来自不同GEO数据集的NSCLC中高分和低分组之间的总体生存 (OS) 的Kaplan–Meier曲线。
  • b, e, h. 展示了来自GSE41271 (b)、GSE37745 (e) 和GSE42127 (h) 队列的NSCLC中高分和低分组的风险得分分布、患者生存状况和基于CAF的风险模型的五个标记的表达情况。
  • c, f, i. 描述了在GSE41271 (c)、GSE37745 (f) 和GSE42127 (i) 数据集中,风险得分在2-, 4-, 6-, 8-, 和10年的OS中的预测效率的时间依赖性接收者操作特性曲线。
  • j–m. 展示了在TCGA和GEO队列中CAF得分和其他临床病理参数对OS的多变量Cox分析。
  • n. 描述了在TCGA和GEO队列中的危险比 (HR) 的Meta分析。

image.png

图 4 高分和低分组之间的纤维细胞特征

  • a. 热图显示了在TCGA队列 (n=803) 中高分和低分组之间经典的癌相关纤维细胞 (CAF) 标记的聚类情况。
  • b-c. 盒图比较了来自TCGA队列的高分和低分组的由 b EPIC 和MCP-counter算法计算的纤维细胞得分;c 在GSE37745和GSE41271队列的两个子组中由MCP-counter算法计算的纤维细胞得分。
  • d-f. 热图显示了来自TCGA和GEO队列的两个子组之间的显著的肌纤维细胞型CAF (myCAFs) 和炎症性CAF (iCAFs) 标记的表达概况。

image.png

图 5 癌相关纤维细胞 (CAF) 分数在肿瘤免疫微环境中的作用

  • a-b. 在TCGA a 和 GSE41271 b 队列中,低分和高分患者之间的免疫得分估计。
  • c. 箱线图比较了来自TCGA队列的两个子组之间的22种免疫细胞的丰度。
  • d. 气泡图显示了CAF分数与在TCGA和GSE41271队列中的28种免疫细胞浸润之间的相关性。
  • e-g. 热图显示了高分组与低分组之间来自TCGA和GEO队列的免疫相关信号和代谢途径的基因集变异分析 (GSVA) 得分。
  • h. 根据来自TCPA数据库的蛋白质芯片数据,高分组与低分组之间差异表达的蛋白质。
  • i. TCGA数据集中,低分和高分患者之间的免疫亚型 (C1-C6) 分布的差异。
  • j-o. 箱线图比较了来自TCGA队列的两个子组之间的增殖,Th2细胞、TCR Shannon、CD8 T细胞、Th1细胞和TGF-beta的得分。

image.png

图 6 癌相关纤维细胞 (CAF) 分数预测非小细胞肺癌 (NSCLC) 对免疫疗法的反应

  • a-b. TCGA队列中高分组 a 和低分组 b 的体细胞突变景观的瀑布图。
  • c-g. 箱线图比较了来自TCGA队列的两个子组之间的TIDE、T细胞功能障碍、T细胞排斥、CD8和CAF得分。
  • h. 免疫治疗队列 (GSE126044 和 GSE135222) 验证了在NSCLC中CAF分数与免疫治疗后的无进展生存 (PFS) 之间的关联。
  • i. GSE126044队列中接受免疫治疗的NSCLC患者中,高分和低分组之间的总体生存 (OS) 的Kaplan–Meier曲线。
  • j. GSE126044和GSE135222数据集中,低分和高分患者之间免疫治疗后的反应性分布的差异。
  • k. 气泡图显示了基于GSE126044和GSE135222数据集的CAF分数与28种免疫细胞浸润之间的相关性。
  • l. 箱线图比较了来自免疫治疗队列的两个子组之间的22种免疫细胞的丰度。
  • m. 热图显示了在GSE126044和GSE135222队列中,高分组相对于低分组的免疫相关信号的基因集变异分析 (GSVA) 得分。

image.png

图 7 单细胞RNA测序分析揭示纤维细胞是FBLIM1产生的主要来源

  • a. GSE131907数据集的统一流形逼近和投影 (UMAP) 图显示了细胞簇。
  • b-c. 小提琴图显示了肿瘤组织中不同细胞簇中FBLIM1 b 或NDN c 的分布。
  • d-e. 小提琴图显示了肺肿瘤和正常肺组织中FBLIM1 d 或NDN e 的表达。
  • f-g. 散点 f 和小提琴 g 图显示了GSE131907数据集中的不同癌相关纤维细胞 (CAF) 子簇。
  • h-i. 散点 h 和小提琴 i 图显示了高表达FBLIM1的细胞的分布。
  • j. FBLIM1阳性CAFs和FBLIM1阴性CAFs之间的前10个差异表达基因 (DEGs) 和TGFB1的表达。
  • k. FBLIM1阳性CAFs和FBLIM1阴性CAFs之间的DEGs的GSEA分析。
  • l. 小提琴和散点图显示了不同CAF子簇中的FBLIM1、ACTA2、S100A4或FAP的分布。
  • m-n. 箱线图比较了TCGA数据集中FBLIM1高表达组和FBLIM1低表达组的CD8 T细胞 m 和TGF-beta反应 n 得分。

image.png

图 8 FBLIM1蛋白的高表达预测了对免疫疗法的劣质反应

  • a. 非小细胞肺癌 (NSCLC) 组织中代表性的FBLIM1阴性和FBLIM1阳性的免疫化学染色。刻度条:50 μm。
  • b. CHCAMS队列中接受免疫治疗的NSCLC患者中,FBLIM1阴性组和FBLIM1阳性组之间的无进展生存 (PFS) 的Kaplan–Meier曲线。
  • c. CHCAMS队列中,响应者 (R) 和非响应者 (NR) 之间FBLIM1表达的分布差异。
  • d. 时间依赖性的接收者操作特性曲线显示了在CHCAMS队列中,FBLIM1表达在100天、200天和300天的PFS中的预测效率。

要点

RNA分析:从TCGA和GEO数据集中搜索RNA序列(RNA-seq)数据,用于预后模型的训练和验证。使用TCGA的基因组分析来比较不同风险亚组之间的突变景观。为了研究CAF标志在免疫疗法中的预后能力,从三个GEO队列中提取了转录组文件和临床信息。同时,使用了其他相关数据集。

WGCNA分析:使用WGCNA分析从TCGA的全基因组转录组数据中识别NSCLC中的CAF标记基因。通过对基因之间的相互作用模式建立了一个基因共表达网络。

CAF预后标志的构建和验证:利用红色模块中的277个CAF标记基因和之前报道的24个经典CAF标记进行单变量Cox回归分析。建立了一个基于五个CAF标记基因的CAF风险模型,这些基因可能是NSCLC患者的潜在治疗靶点。

CAF浸润分析:使用了三种算法来从整体RNA-seq数据中量化CAF种群的丰度。

肿瘤间质和免疫细胞浸润分析:使用了多种方法和工具来估计肿瘤组织中的间质和免疫得分,并描绘NSCLC的免疫浸润景观。

通路和功能富集分析:进行了GO和KEGG富集分析,并执行GSVA来估计高得分组和低得分组之间的途径活动的变化。

免疫治疗反应和潜在治疗药物预测:使用了多种方法和工具来预测CAFs标志在免疫治疗中的反应和潜在的治疗药物。

单细胞分析:利用GSE131907的数据进一步识别CAF亚型并诠释预后差异的分子机制。

免疫组化:使用了21个NSCLC肿瘤组织的石蜡包埋切片进行了免疫组化实验,来观察FBLIM1的表达。

目录
相关文章
|
7月前
|
计算机视觉
【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割
【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割
51 0
|
网络协议 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
|
3月前
|
存储 数据挖掘
单细胞|线粒体基因型和DNA可及性联合分析
单细胞|线粒体基因型和DNA可及性联合分析
92 15
单细胞|线粒体基因型和DNA可及性联合分析
|
6月前
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
352 3
|
7月前
|
运维
ICLR 2024:跨领域准确进行零样本异常检测,浙大等提出AnomalyCLIP
【5月更文挑战第12天】 浙大、新大和哈佛研究人员合作提出AnomalyCLIP,利用预训练的视觉-语言模型CLIP,学习对象无关文本提示,实现准确的跨领域异常检测。在17个数据集上表现出色,但存在特定领域适应性和计算复杂度问题。研究表明潜力,尤其对工业和医学图像分析。[论文链接](https://arxiv.org/pdf/2310.18961.pdf)
195 1
|
7月前
|
搜索推荐 数据挖掘 Java
文献速读|7分的干湿结合胃癌单细胞联合bulk转录组+线粒体自噬
研究人员通过单细胞和bulk RNA测序,鉴定出18个线粒体自噬相关基因(MRGs),在胃癌中的预后作用。这些基因可能成为新的生物标志物和治疗靶点。分析显示GABARAPL2和CDC37在上皮细胞中高度表达,与免疫浸润和预后相关。构建的风险模型在多个独立队列中验证有效,表明MRGs可改善预后预测,并提示免疫治疗潜力。研究强调了单细胞分析在理解疾病复杂性和指导个性化治疗中的价值。
161 3
|
数据挖掘 Go 计算机视觉
文献丨群体转录组分析eQTLs调控基因表达
文献丨群体转录组分析eQTLs调控基因表达
|
大数据 数据挖掘 Go
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(一)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控
|
数据可视化 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
|
7月前
|
机器学习/深度学习 算法 数据挖掘
JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR
本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。
143 0
下一篇
DataWorks