组学生信| Front Immunol |基于血清蛋白质组早期诊断标志筛选的简单套路

简介: 组学生信| Front Immunol |基于血清蛋白质组早期诊断标志筛选的简单套路

fii

前排广告:有个性化定制发文需求,可加微信:mzbj0002咨询。

今天分享一篇FII上近期发表的文章,内容还是比较简单的,大家可以简单学习一下。(CNS大佬就略过哈~)

值得注意是是,这篇文章的作者的分析和绘图是在SPSSGraphPad Prism上完成的,至于生信部分则是在悟空云平台上完成的,PPI则是常规的string+cytoscape。可见,简单的生信分析用别人造好的轮子也未尝不可。

❞❝

「Title:」 Serum Proteomic Analysis Identifies SAA1, FGA, SAP, and CETP as New Biomarkers for Eosinophilic Granulomatosis With Polyangiitis

「Link:」  https://doi.org/10.3389/fimmu.2022.866035

「期刊:」 Frontiers in Immunology

「2021IF:」 8.786

「Received:」 30 January 2022; 「Accepted:」 06 May 2022;「Published:」 10 June 2022.

研究目的

寻找早期诊断嗜酸性肉芽肿性多血管炎(EGPA,Eosinophilic granulomatosis with polyangiitis)的血清生物标志物,并将EGPA严重哮喘区分开来。

流程图

Schematic workflow of the study

116个血浆样本分为两个队列 :发现队列和验证队列。包括58例EGPA,33例严重哮喘病人和25例健康患者对照。发现队列用DIA质谱技术,验证队列用PRM质谱技术。

关于不同的质谱技术的差别,大家可以自行搜索。简单来说DIA用于获得完整的数据,实现蛋白质的深度覆盖和精准定量。而PRM则可以基于DIA建的库对目标蛋白进行靶向检测和验证。

蛋白差异分析

相关分析质控就不说了。之后对三组做了PCA,然后两两分组间做了差异分析,主图用了火山图进行展示。这里的差异分析用的t检验B-H法计算FDR。注意,以上分析都是在发现队列中做的,为了找maker蛋白。

Identification of differentially expressed proteins.

找到候选靶蛋白

接下来,作者直接一套GO富集+KEGG富集+PPI组合拳打下来,找到主要富集通路的23个差异蛋白作为候选靶蛋白。

Bioinformatics analysis of the DEPs

候选靶蛋白的验证和评估

验证队列中发现候选靶蛋白中只有有4个蛋白与发现队列保持一致,然后作者就选了这4个蛋白进行验证。(这也是蛋白质组的一个通病,不同批次的结果往往不太一致,甚至蛋白种类和数量都有差别,不易重复。)

然后,作者就在验证队列中,对这4个蛋白进行统计分析,这里用没有箱子的箱线图展示。紧接着,作者对这4种蛋白各种组合进行了简单的ROC分析,展示了几个AUC比较高的ROC曲线图。(为什么不建几个简单的机器学习模型呢?)

Validation and evaluation of candidate biomarkers

后面就是丰满一下要讲的故事

这里作者挑个了临床参数(嗜酸性粒细胞计数)和这4个蛋白做了相关分析。这里用了非参数的 Spearman相关分析。至于PearsonSpearman各自的适用范围,大家可以自行查询,亦可在我们的交流群里交流讨论。

The correlation between serum SAA1 (A), FGA (B), SAP (C), CETP (D), and eosinophil count

「讨论部分」,先讲了一下找到疾病诊断标志物的必要性。然后,介绍一下最后验证的4种靶蛋白。简单说一下不足的地方和后面的计划,比如作者这里就说需要在更大的队列中用其它方式进行验证,如ELISA等。当然,我们自己做的话最好直接加上ELISA或者WB验证。

总结

以上就是全部内容了,套路还是比较简单的。当然,罕见病例的大量样本组学测序本身就劝退很多人了。再加几个组学丰富一下故事还是有机会冲击高分的。

相关文章
|
6月前
|
监控
2、软件项目跟踪和监督过程——所有表集合
2、软件项目跟踪和监督过程——所有表集合
69 0
文本,好看的设计------我独自升级,六芒星技能表,可以用来判断是否在能力值之内的事情,使用六芒星可以显示能力之内,能力之外的事情,用以判断
文本,好看的设计------我独自升级,六芒星技能表,可以用来判断是否在能力值之内的事情,使用六芒星可以显示能力之内,能力之外的事情,用以判断
文本,好看的设计------我独自升级,六芒星技能表,可以用来判断是否在能力值之内的事情,使用六芒星可以显示能力之内,能力之外的事情,用以判断
|
6月前
|
XML 算法 C语言
【C/C++ 静态代码检查工具 Cppcheck 】Cppcheck 检测器列表和检查规则大全一览
【C/C++ 静态代码检查工具 Cppcheck 】Cppcheck 检测器列表和检查规则大全一览
573 0
|
6月前
|
前端开发
【简历优化平台-02】缺失信息和不规范信息的过滤层
【简历优化平台-02】缺失信息和不规范信息的过滤层
|
6月前
|
人工智能 算法 测试技术
【简历优化平台-03】轻字段信息的合理性及单独算法
【简历优化平台-03】轻字段信息的合理性及单独算法
|
机器学习/深度学习 存储 人工智能
【网安AIGC专题11.8】论文15 ChatGPT在软件工程中的全面作用:程序语法(AST生成、表达式匹配) 静态行为、动态分析(数据依赖和污点分析、指针分析) 提示设计(角色提示、指令提示)
【网安AIGC专题11.8】论文15 ChatGPT在软件工程中的全面作用:程序语法(AST生成、表达式匹配) 静态行为、动态分析(数据依赖和污点分析、指针分析) 提示设计(角色提示、指令提示)
117 0
P1098 [NOIP2007 提高组] 字符串的展开(模拟分析能力)
P1098 [NOIP2007 提高组] 字符串的展开(模拟分析能力)
99 0
|
编解码 计算机视觉 Python
2023年电赛---运动目标控制与自动追踪系统(E题)关于网友的问题回复
2023年电赛---运动目标控制与自动追踪系统(E题)关于网友的问题回复
420 0
|
Shell Linux 测试技术
CORNAS:一种快速简单鉴定无重复转录组差异基因的方法
还记得上次文章的最后提到CORNAS这种方法吗?最近刚好在Github上看到了这个项目,就花了点时间看了下文档感觉操作也比较简单,这里记录一下使用过程,大家共同学习一下。
183 0
|
Linux Windows Perl
没有生物学重复的转录组数据怎么进行差异分析?
设置生物学重复这个环节也是你实验设计很重要的一part,设置的好对你下游分析也有利,通常我们做转录组测序,需要的样本量每组至少为3个生物学重复,这个处理起来就很合理,并且现在流行的差异分析软件DEseq2,limma,edgeR等等都是针对有重复的数据去做的,但有时候会不幸碰到样品测序失败不能用,导致每组就给你剩一个重复时候该怎么办,之前我有批数据就是这样,但是办法总比困难多不能放过任何实验数据,搜了搜其实还是有一些方法可以去解决的,在这里介绍下我搜到的几种方法。
959 0