目前R中绘制热图的方式有很多,常用的如pheatmap、ComplexHeatmap包等,这里再给大家介绍一个轻量级的R包-HeatmapR包,即无需过多的前期数据处理,可同时可视化含有离散型和连续性的矩阵。
Github地址:https://github.com/DillonHammill/HeatmapR
准备数据
## 按照R包 devtools::install_github("DillonHammill/HeatmapR") library(HeatmapR) ## 准备数据 data <- mtcars data <- data[sample(nrow(data),20),] head(data) > str(data) 'data.frame': 20 obs. of 11 variables: $ mpg : num 21.4 17.8 32.4 30.4 18.1 27.3 22.8 21 19.2 16.4 ... $ cyl : num 4 6 4 4 6 4 4 6 8 8 ... $ disp: num 121 167.6 78.7 75.7 225 ... $ hp : num 109 123 66 52 105 66 93 110 175 180 ... $ drat: num 4.11 3.92 4.08 4.93 2.76 4.08 3.85 3.9 3.08 3.07 ... $ wt : num 2.78 3.44 2.2 1.61 3.46 ... $ qsec: num 18.6 18.9 19.5 18.5 20.2 ... $ vs : num 1 1 1 1 1 1 1 0 0 0 ... $ am : num 1 0 1 1 0 1 1 1 0 0 ... $ gear: num 4 4 4 4 3 4 4 4 3 3 ... $ carb: num 2 4 1 2 1 1 1 4 2 3 ...
目前,数据集里各列都是数值型的数据,先简单出图看下效果。
基础绘图
library(HeatmapR) heat_map( data, scale = "column", scale_method = "range", # "range", "mean" or "zscore" 三种标准化方式 tree_x = TRUE, ## 显示X轴聚类 tree_y = TRUE, ##显示Y轴聚类 tree_cut_x = 4, ## 行分割数 tree_cut_y = 12, ##列分割数 cell_text = TRUE, ## 显示数值 cell_text_col = 'black', cell_size = TRUE, ## 控制大小 cell_shape = "diamond", #设置性状 title = "mtcars" )
添加缺失值并改变数据类型
此包的便捷性在于可将同时含有连续性和离散型矩阵可视化热图,这里随机添加几个缺失值,并改变cyl列的数据为因子类型,然后再绘制热图看下效果。
## 添加NA值并改变某列为因子型 data[c(2, 19, 14, 7), 3] <- NA data[c(4, 9, 17, 20), 4] <- NA data$cyl <- factor(data$cyl) str(data) > str(data) 'data.frame': 20 obs. of 11 variables: $ mpg : num 21.4 17.8 32.4 30.4 18.1 27.3 22.8 21 19.2 16.4 ... $ cyl : Factor w/ 3 levels "4","6","8": 1 NA 1 1 2 1 NA 2 3 3 ... $ disp: num 121 167.6 78.7 NA 225 ... $ hp : num 109 123 66 52 105 66 93 110 175 180 ... $ drat: num 4.11 3.92 4.08 4.93 2.76 4.08 3.85 3.9 3.08 3.07 ... $ wt : num 2.78 3.44 2.2 1.61 3.46 ... $ qsec: num 18.6 18.9 19.5 18.5 20.2 ... $ vs : num 1 1 1 1 1 1 1 0 0 0 ... $ am : num 1 0 1 1 0 1 1 1 0 0 ... $ gear: num 4 4 4 4 3 4 4 4 3 3 ... $ carb: num 2 4 1 2 1 1 1 4 2 3 ... ## 绘制热图 heat_map( data, scale = "column", scale_method = "range", # "range", "mean" or "zscore" 三种方式 tree_x = TRUE, ## 显示X轴聚类 tree_y = TRUE, ##显示Y轴聚类 tree_cut_x = 4, tree_cut_y = 12, cell_text = TRUE, cell_text_col = 'black', #cell_size = TRUE, ## 控制大小 cell_shape = "diamond", #设置性状 title = "mtcars", cell_col_empty = "red", cell_col_scale = c( ##连续性数据配色 '#2ab49b', 'white', '#ea7f58' ), cell_col_palette = c( ##离散型数据配色 "#197fcd", "#00c347", "#fb3b65" ), cell_col_alpha = 1 )
其它功能
添加柱状图
heat_map( data, cell_col_scale = c( ##连续性数据配色 '#2ab49b', 'white', '#ea7f58' ), scale = "column", scale_method = "range", bar_values_x = 1:ncol(mtcars), bar_size_x = 0.5, bar_fill_x = rainbow(ncol(mtcars)), bar_line_col_x = "black", bar_values_y = 1:nrow(mtcars), bar_size_y = 0.8, bar_fill_y = rainbow(ncol(mtcars)), bar_line_col_y = "black", title = "heatmap with bar plots" )
该包参数非常多,也基本涵盖了热图常用的调参细节,如添加行与列分组注释,聚类方法设置,图例与导出等等,感兴趣的可以参考HeatmapR • HeatmapR (dillonhammill.github.io)指南进行学习,这里不再一一介绍了。