fii
❝前排广告:有个性化定制发文需求,可加微信:
❞mzbj0002
咨询。
今天分享一篇FII
上近期发表的文章,内容还是比较简单的,大家可以简单学习一下。(CNS大佬就略过哈~)
❝值得注意是是,这篇文章的作者的分析和绘图是在
❞❝SPSS
和GraphPad Prism
上完成的,至于生信部分则是在悟空云平台
上完成的,PPI
则是常规的string
+cytoscape
。可见,简单的生信分析用别人造好的轮子也未尝不可。「Title:」 Serum Proteomic Analysis Identifies SAA1, FGA, SAP, and CETP as New Biomarkers for Eosinophilic Granulomatosis With Polyangiitis
「Link:」 https://doi.org/10.3389/fimmu.2022.866035
「期刊:」 Frontiers in Immunology
「2021IF:」 8.786
「Received:」 30 January 2022; 「Accepted:」 06 May 2022;「Published:」 10 June 2022.
❞
研究目的
寻找早期诊断嗜酸性肉芽肿性多血管炎
(EGPA,Eosinophilic granulomatosis with polyangiitis)的血清生物标志物
,并将EGPA
与严重哮喘
区分开来。
流程图
Schematic workflow of the study
116个血浆样本分为两个队列 :发现队列和验证队列。包括58例EGPA,33例严重哮喘病人和25例健康患者对照。发现队列用DIA质谱技术,验证队列用PRM质谱技术。
❝关于不同的质谱技术的差别,大家可以自行搜索。简单来说DIA用于获得完整的数据,实现蛋白质的深度覆盖和精准定量。而PRM则可以基于DIA建的库对目标蛋白进行靶向检测和验证。
❞
蛋白差异分析
相关分析
做质控
就不说了。之后对三组做了PCA
,然后两两分组间做了差异分析
,主图用了火山图
进行展示。这里的差异分析用的t检验
,B-H
法计算FDR
。注意,以上分析都是在发现队列
中做的,为了找maker
蛋白。
Identification of differentially expressed proteins.
找到候选靶蛋白
接下来,作者直接一套GO富集
+KEGG富集
+PPI
组合拳打下来,找到主要富集通路
的23个差异蛋白作为候选靶蛋白。
Bioinformatics analysis of the DEPs
候选靶蛋白的验证和评估
在验证队列
中发现候选靶蛋白中只有有4个蛋白与发现队列保持一致,然后作者就选了这4个蛋白进行验证。(这也是蛋白质组的一个通病,不同批次的结果往往不太一致,甚至蛋白种类和数量都有差别,不易重复。)
然后,作者就在验证队列中,对这4个蛋白进行统计分析,这里用没有箱子的箱线图展示。紧接着,作者对这4种蛋白各种组合进行了简单的ROC
分析,展示了几个AUC
比较高的ROC
曲线图。(为什么不建几个简单的机器学习模型呢?)
Validation and evaluation of candidate biomarkers
后面就是丰满一下要讲的故事
这里作者挑个了临床参数(嗜酸性粒细胞计数)和这4个蛋白做了相关分析。这里用了非参数的 Spearman
相关分析。至于Pearson
和Spearman
各自的适用范围,大家可以自行查询,亦可在我们的交流群
里交流讨论。
The correlation between serum SAA1 (A), FGA (B), SAP (C), CETP (D), and eosinophil count
「讨论部分」,先讲了一下找到疾病诊断标志物的必要性。然后,介绍一下最后验证的4种靶蛋白。简单说一下不足的地方和后面的计划,比如作者这里就说需要在更大的队列中用其它方式进行验证,如ELISA
等。当然,我们自己做的话最好直接加上ELISA
或者WB
验证。
总结
以上就是全部内容了,套路还是比较简单的。当然,罕见病例的大量样本组学测序本身就劝退很多人了。再加几个组学丰富一下故事还是有机会冲击高分的。