跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图

简介: 跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图

读图


样本首先按AFP(甲胎蛋白)水平排列(从低AFP(≤200,灰色)到高AFP(>200,红色),然后按MVI(从MVI否到MVI是)排序。成对的样本用灰色直线标注。拟合的虚线曲线显示了蛋白质在肿瘤(红色,n=98)和非肿瘤(蓝色,n=98)样本中的分布。阴影表示95%的置信区间。


思路


两步走,分别做分类变量的格子热图和哑铃图。


先将AFP从低到高排列,再分为低和高。注意改变因子level。


格子热图可以用geom_tile()绘制。


哑铃图即是分组散点图加线段,用geom_segment()绘制。


将两个图进行拼接,注意拼接比例。


绘制


数据格式

示例数据是自己随机创建的,无实际意义。

image.png


导入并预处理数据

rm(list = ls())
setwd("F:/~/mzbj/mzbj_note/nature_figure1")
data <- read.csv("sample.csv")
df_order <- data[order(data$AFPVALUE),] #排序
df_cell <- data[,c(1,5,6)] #做小热图用的数据
df2=melt(df_cell,id="SAMPLE") #数据变换
#改变level
data$SAMPLE <- factor(data$SAMPLE, levels = df_order$SAMPLE )
df2$SAMPLE <- factor(df2$SAMPLE, levels = df_order$SAMPLE )
df2$variable <- factor(df2$variable,levels = c("MSI","AFP"))

绘制分类变量的格子热图

#设置颜色
cols=c(
  "H"="#FE8B91","L"="gray",
  "Y"="#FE8B91","N"="gray"
)
p1 <- ggplot(df2,aes(x=SAMPLE,y=variable),size=0.1)+
  geom_tile(aes(fill=value),color="white",size=0.1)+ 
  scale_x_discrete("",expand = c(0,0))+ 
  scale_y_discrete("",expand = c(0,0))+
  scale_fill_manual(values = cols)+ #指定自定义的颜色
  theme(
    axis.text.x.bottom = element_blank(),#修改坐标轴文本大小
    axis.ticks = element_blank(), #不显示坐标轴刻度
    legend.title = element_blank() #不显示图例title
  )
p1

image.png

绘制配对哑铃图并添加拟合线

p2 <- ggplot(data) +
  geom_segment(aes(
    x = SAMPLE,
    xend = SAMPLE,
    y = value1,
    yend = value2
  ),
  color = "#DDEAF6",
  size = 0.3) +
  geom_point(
    aes(x=SAMPLE, y=value1),
    group = 1,
    color = "#96A6E7",
    size = 3
  ) +
  stat_smooth(aes(x = as.numeric(SAMPLE), y = value1),
              method=loess,
              linetype = 2,
              color = '#96A6E7',
              fill = '#D9F6F6',
              level=0.95) +
  geom_point(
    aes(x=as.numeric(SAMPLE), y=value2),
    color = "#FE8B91",
    size = 3
  ) +
  stat_smooth(aes(x = as.numeric(SAMPLE), y = value2),
              method=loess,
              linetype = 2,
              color = '#FE8B91',
              fill = '#FEECEA',
              level=0.95) +
  theme_classic() +
  theme(axis.ticks.x = element_blank(),
        axis.line.x = element_blank(),
        axis.text.x = element_blank())
p2

image.png

按比例拼接

library(patchwork)
p1/p2+plot_layout(heights = c(0.1, 1))

image.png

基本上还原了这个图。图例部分在AI里进行简单的修正即可~


不足之处

作者在文章中写的是用的lasso曲线进行拟合~这里用了loess方法进行拟合,暂时还不知道method = glm时如何选用lasso


相关文章
|
机器学习/深度学习 算法 数据挖掘
统计分析识别和处理异常值
统计分析识别和处理异常值
621 0
|
机器学习/深度学习 算法
R语言超参数调优:深入探索网格搜索与随机搜索
【9月更文挑战第2天】网格搜索和随机搜索是R语言中常用的超参数调优方法。网格搜索通过系统地遍历超参数空间来寻找最优解,适用于超参数空间较小的情况;而随机搜索则通过随机采样超参数空间来寻找接近最优的解,适用于超参数空间较大或计算资源有限的情况。在实际应用中,可以根据具体情况选择适合的方法,并结合交叉验证等技术来进一步提高模型性能。
1129 5
|
机器学习/深度学习 数据采集 数据可视化
R语言电影数据分析:随机森林探索电影受欢迎程度因素、参数调优可视化
R语言电影数据分析:随机森林探索电影受欢迎程度因素、参数调优可视化
|
Ubuntu Linux Docker
Win11彻底卸载WSL2系统(去除导航窗格Linux图标)
Win11彻底卸载WSL2系统(去除导航窗格Linux图标)
16265 50
hutool excel写数据
hutool excel写数据
262 1
|
数据可视化
R语言使用蒙特卡洛模拟进行正态性检验及可视化
R语言使用蒙特卡洛模拟进行正态性检验及可视化
|
数据挖掘
R实战 | 环状热图(circos)
R实战 | 环状热图(circos)
765 0
|
数据挖掘
SPSS两相关样本检验
SPSS两相关样本检验
256 0
|
数据可视化
R绘图 | 云雨图+双向条形图
R绘图 | 云雨图+双向条形图
412 0
|
数据采集 机器学习/深度学习 人工智能
数据清洗、数据处理入门!R语言我来了,数据不再零散!
「数据清洗」和「预处理」是数据科学中必不可少的一部分,它们能够帮助我们准确地分析和预测未来趋势。如果你曾经尝试过进行分析或建模,你会发现数据往往不像我们所想象的那样干净、整洁。需要对数据进行仔细的检查、清理和处理,才能真正把数据转变成有用的信息。
856 0