今天给大家分享一篇IF=7.4
的纯生信的文章,2023年3月发表在Journal of Translational Medicine:Identification of hub genes and potential molecular mechanisms related to radiotherapy sensitivity in rectal cancer based on multiple datasets,基于多数据集鉴定直肠癌放疗敏感性相关的核心基因和潜在分子机制
摘要
- 背景:
放疗抵抗是局部晚期直肠腺癌(READ
)肿瘤消退率低的主要原因。与放疗敏感性相关的生物标志物和潜在的分子机制尚未完全阐明。 - 方法:
从癌症基因组图谱 (TCGA) 和基因表达综合 (GEO) 数据库获取 READ (GSE35452
) 的 mRNA 表达谱和基因表达数据集。筛选出READ放疗应答者和非应答者之间的差异表达基因(DEG
)。对差异基因进行了基因本体(GO)分析和京都基因和基因组百科全书(KEGG
)通路分析。随机生存森林分析用于通过randomForestSRC
包识别枢纽基因。基于CIBERSORT算法、癌症药物敏感性基因组学(GDSC
)数据库、基因集变异分析(GSVA)、富集分析(GSEA)、列线图、基序富集和非编码RNA网络分析,研究中枢基因与免疫细胞之间的关联浸润、药物敏感性、特定信号通路、预后预测以及TF-miRNA
调控和ceRNA
网络进行了研究。临床样本中枢纽基因的表达通过在线人类蛋白质图谱(HPA
)显示。 - 结果:
READ 中总共注册了 544 个上调 DEG 和 575 个下调 DEG。其中,确定了三个枢纽,包括PLAGL2
、ZNF337
和ALG10
。这三个枢纽基因与肿瘤免疫浸润、不同的免疫相关基因以及化疗药物的敏感性显着相关。此外,它们与各种疾病相关基因的表达相关。此外,GSVA和GSEA分析显示PLAGL2、ZNF337和ALG10的表达水平不同影响与疾病进展相关的多种信号通路。基于三个中心基因的列线图和校准曲线显示出出色的预后预测性能。然后,建立了转录因子(ZBTB6)-mRNA(PLAGL2)
的调控网络和miRNA(has-miR-133b)-lncRNA
的ceRNA网络。最后,HPA在线数据库的结果表明,READ患者中PLAGL2、ZNF337和ALG10的蛋白表达水平差异很大。 - 结论:
这些发现表明READ中PLAGL2
、ZNF337
和ALG10
的上调与放疗反应相关,并参与肿瘤细胞生物学的多个过程。它们可能是放射治疗敏感性和READ
预后的潜在预测生物标志物。
结果
图 1. 差异表达基因 (DEG) 的火山图和热图
- A DEG 的火山图。红色:上调基因;绿色:下调基因;B READ 放疗无反应者(绿色)和反应者(橙色)之间的 DEG 热图。蓝色:低表达水平;红色:高表达水平
图 2. TCGA-READ 队列中 DEG 的随机生存森林分析
- A DEG 的随机生存森林分析 。B 八个基因被确定为最终标记,其可变相对重要性 > 0.3。C根据 Kaplan-Meier 生存分析,与低表达相比, PLAGL2、ZNF337 D 和ALG10 E 的高表达 与更好的总生存期显着相关(分别为P = 0.018、P < 0.001 和P = 0.007)。F. _ ZNF337、PLAGL2和ALG10的表达放射治疗有反应的 READ 患者显着高于无反应的患者(* 表示P < 0.05)
图 3. 从 TCGA 检索的队列中与三个中心基因相关的免疫浸润细胞的组成
- A:正常组和READ患者之间免疫细胞的百分比。绿色:正常对照组;紫色:READ 组。B:READ患者22种不同免疫细胞之间的相互作用分析
图 4. Hub基因与疾病相关基因的关系
- A 对照和READ患者之间多种疾病相关基因表达的比较。B三个中心基因( ALG 10、PLAGL2和ZNF337)与疾病相关基因 之间的皮尔逊相关性的气泡图。(圆圈越大,P值越接近0;颜色越红,正相关越强;紫色越深,负相关越强)
图 5. GSVA和GSEA分析ALG10、PLAGL2和ZNF337的高低表达
- A:ALG10的GSVA;B:PLAGL2的 GSVA ;C : ZNF337的 GSVA ;D : ALG10的 GSEA ;E : PLAGL2的 GSEA ;F:ZNF337的 GSEA 。
图 6. 预测 READ 患者预后的列线图
- 列线图是根据ALG10、PLAGL2和ZNF337的表达以及临床参数构建的。B:TCGA READ 数据集中用于预测 1 年和 3 年 OS 的列线图校准曲线
图 7. 枢纽基因的调控网络分析
- A :通过R包中的“RcisTarget”对ALG10、PLAGL2和ZNF337转录因子进行富集分析;B:cisbp_M6542 的基序;C:cisbp_M4151 的基序;D:cisbp_M0562 的基序;E:中心基因的部分富集基序和相应的转录因子
图 8. GWAS 分析的结果
- A:GWAS 的 Q - Q 图;B:GWAS 的曼哈顿图;C : PLAGL2位于 20 号染色体的致病区域。D : ALG10位于 12 号染色体的致病区域。E : ZNF337位于 20 号染色体的致病区域
图 9. 中心基因的 CeRNA 网络分析
- A:分别从 HMDD 和 mirWalk 数据库中鉴定出25 个与 READ 相关的 miRNA 和 1,007 个与ALG10、PLAGL2和ZNF337相关的 miRNA;B :构建了mRNA( PLAGL2 )-miRNA(has-miR-133b)-lncRNA(共157个)的ceRNA网络
图 10. ZNF337、ALG10和PLAGL2在直肠组织和结直肠癌中的蛋白表达水平
小总结
- 该篇是一个很中规中矩的肿瘤筛选标志物的研究思路,分析的方法复现起来也没有太多难度,创新切入点就是
READ的放疗抵抗
,套用其他疾病的话需要查文献结合生物学角度和临床研究确定是否可行。 - 还是捋一捋:按
是否放疗应答分组
做差异分析,然后用随机森林筛选出三个核心基因,按疾病对照分组
免疫浸润,疾病基因相关性,GSEA和GSVA,临床性状列线模型,转录因子富集,CeRNA网络,GWAS染色体位置,HPA数据库的免疫组化 - 有部分做纯生信的小伙伴不要看到切片图像就划走,不少文章的免疫组化用的都是HPA数据库https://www.proteinatlas.org/的图像,这类虽然不算真正意义上的干湿结合,但是在病理检验上有那么一点正向验证作用。公共数据库存在的意义也大概如此。