科研绘图丨使用R语言Pheatmap包快速绘制基因表达量热图的方法,支持聚类和配色自定义修改

简介: 科研绘图丨使用R语言Pheatmap包快速绘制基因表达量热图的方法,支持聚类和配色自定义修改

Pheatmap绘制基因表达量热图

论文中展示基因表达量变化通常使用热图,今天分享一个快速绘制不同基因在各处理下表达量变化的方法,使用R语言中pheatmap包,它可以用于可视化数据集中的数值,以便更好地理解数据之间的关系和模式。

创建环境与示例数据

加载R包

library(tibble)
library(tidyverse)
library(pheatmap)

生成随机数据

# 设置随机数种子以确保结果可重复
set.seed(1234)
# 生成随机矩阵
expr_mat <- matrix(rnorm(200, mean = 6, sd = 2), ncol = 8)
# 将矩阵转换为tibble,并设置行名称和列名称
expr_mat <- as_tibble(expr_mat, colnames = paste0("Type", 1:8))
colnames(expr_mat) <- paste0("Type", 1:8)
rownames(expr_mat) <- paste0("Gene",1:25)
# 查看结果
head(expr_mat)

通过上述代码可以生成一个随机的基因表达矩阵,其中每行是一个基因,每列代表一个处理,共有25行8列,展示了25个不同的基因在8个不同处理下表达量的变化情况。数据内容如下:

> head(expr_mat)
# A tibble: 6 × 8
  Type1 Type2 Type3 Type4 Type5 Type6 Type7  Type8
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>  <dbl>
1  3.59  3.10  2.39  5.69  6.83  6.16  5.25  4.32 
2  6.55  7.15  4.84  3.22  5.05  4.74  6.20  3.75 
3  8.17  3.95  3.78  4.55  6.13  2.97  9.28 12.1  
4  1.31  5.97  3.97  6.52  5.00  4.73  4.25  6.47 
5  6.86  4.13  5.68  5.37  4.35  6.45  6.24  5.93 
6  7.01  8.20  7.13  5.64  6.33  8.03  8.72  0.536

image-20230522103940222

绘制图像

基础版热图

pheatmap(expr_mat)

直接运行pheatmap函数,输入数据矩阵,即可快速生成漂亮的热图,会自动对行和列进行聚类,这也是最简单的热图生成方法。

image-20230522104202610

进阶版热图

my_palette <- colorRampPalette(c("white", "yellow","red"))(n = 100)
pheatmap(expr_mat,
         cluster_cols = F,
         cluster_rows = T,
         filename = "GeneExpr.pdf",
         color = my_palette,
         width = 2.35*3,
         height = 1*3,
         angle_col = 0)

通常绘制基因表达热图的目的是看不同基因和处理之间的变化关系,比如不同时间下基因的表达量变化,因此不需要对处理进行聚类,为了让图中横轴Type按照顺序排列,取消纵轴聚类,可以使用cluster_cols = F参数,另外可以自定义修改配色的方案,使用colorRampPalette可以自定义颜色。

image-20230522104737544

上面的代码会在当前工作目录下生成一个pdf图片文件,如果想让pheatmap绘制的图形直接显示在Rstudio的右下角plot窗口,删除filename = "GeneExpr.pdf"参数即可。

pheatmap 函数可以根据数据集的值自动为每个单元格分配颜色,并且可以对行和列进行聚类以更好地显示数据之间的关系。此外,pheatmap 还支持自定义颜色映射,使用户可以将数据映射到自定义颜色范围中。

以下是 pheatmap 函数的一些常见参数:

  • data:要绘制的数据集。
  • scale:是否对数据进行标准化。默认为 "row",表示对每一行进行标准化。也可以设置为 "column" 或 "none"。
  • color:颜色映射。可以使用内置的颜色映射,也可以使用 colorRampPalette 函数创建自定义颜色映射。
  • cluster_rowscluster_cols:是否对行和列进行聚类。默认为 TRUE。
  • show_rownamesshow_colnames:是否显示行名和列名。默认为 TRUE。
  • fontsize_rowfontsize_col:行名和列名的字体大小。默认为 12。

END

© 素材来源于网络,侵权请联系后台删除

笔记合集,点击直达

相关文章
|
11天前
|
数据采集 数据处理
R语言处理DNA等位基因不平衡(一)
该文介绍了等位基因不平衡分析在生物信息学和基因组学中的应用,用于识别受选择压力的基因。等位基因不平衡指基因座上两个等位基因表达比例不均,可能因自然选择等因素引起。研究通过系统分析特定区域的等位基因不平衡,识别关键基因在生物过程或疾病中的作用。示例代码展示了如何处理和分析数据,包括导入数据、预处理、等位基因不平衡测试以及结果输出。该分析适用于DNA数据,未来将推出针对RNA的数据处理方法。
14 0
|
1月前
|
机器学习/深度学习 数据可视化 算法
从零到精通:学习这些R语言必学包成为数据分析高手!
从零到精通:学习这些R语言必学包成为数据分析高手!
35 0
|
4月前
|
存储 人工智能 搜索推荐
R语言Ternary包绘制三元图、RGB三色空间分布图的方法
R语言Ternary包绘制三元图、RGB三色空间分布图的方法
|
4月前
|
定位技术
R语言GD包地理探测器分析时报错、得不到结果等情况的解决方案
R语言GD包地理探测器分析时报错、得不到结果等情况的解决方案
|
4月前
|
定位技术 Python
R语言raster包批量拼接、融合大量栅格图像
R语言raster包批量拼接、融合大量栅格图像
|
4月前
|
定位技术 Python
R语言raster包遍历多个文件夹并批量计算每一个文件夹下全部遥感影像的平均值
R语言raster包遍历多个文件夹并批量计算每一个文件夹下全部遥感影像的平均值
|
4月前
|
定位技术
R语言raster包计算多个栅格图像平均值、标准差的方法
R语言raster包计算多个栅格图像平均值、标准差的方法
|
4月前
|
存储 数据可视化 定位技术
R语言GD包基于栅格图像实现地理探测器与连续参数的自动离散化
R语言GD包基于栅格图像实现地理探测器与连续参数的自动离散化
|
4月前
|
数据采集 定位技术
R语言geodetector包基于栅格图像实现地理探测器操作
R语言geodetector包基于栅格图像实现地理探测器操作
|
4月前
|
Serverless 定位技术 C++
R语言raster包批量读取单一或大量栅格图像
R语言raster包批量读取单一或大量栅格图像