pheatmap|暴雨暂歇,“热图”来袭!!!

简介: pheatmap|暴雨暂歇,“热图”来袭!!!

本文首发于“生信补给站”公众号 pheatmap|暴雨暂歇,“热图”来袭!!!

热图可以聚合大量的数据,并可以用一种渐进色来优雅地表现,可以很直观地展现数据的疏密程度或频率高低。

   本文利用R语言 pheatmap 包从头开始绘制各种漂亮的热图。参数像积木,拼凑出你最喜欢的热图即可,如下图:

    基因和样本都可以单独聚类,排序,聚类再分组,行列注释,配色调整,调整聚类线以及单元格的宽度和高度均可实现。

image.png


载入数据,R包



#R包
library(pheatmap)
# 构建测试数据 
set.seed(1234)
test = matrix(rnorm(200), 20, 10)
test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3 
test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2 
test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4 
colnames(test) = paste("Test", 1:10, sep = "")
rownames(test) = paste("Gene", 1:20, sep = "")
head(test[,1:6])

image.png

绘制热图

绘制默认热图


pheatmap(test)

image.png

基本参数

# scale = "row"参数对行进行归一化

# clustering_method参数设定不同聚类方法,默认为"complete",可以设定为'ward', 'ward.D', 'ward.D2', 'single', 'complete', 'average', 'mcquitty', 'median' or 'centroid'


pheatmap(test,scale = "row", clustering_method = "average")

image.png


#表示行聚类使用皮尔森相关系数聚类,默认为欧氏距离"euclidean"


pheatmap(test, scale = "row", clustering_distance_rows = "correlation")

image.png


#行 列是否聚类,cluster_row ,cluster_col


pheatmap(test, cluster_row = FALSE,cluster_col = TRUE)

image.png


# treeheight_row和treeheight_col参数设定行和列聚类树的高度,默认为50


pheatmap(test, treeheight_row = 30, treeheight_col = 50)

image.png


# 设定cell 的大小


pheatmap(test, cellwidth = 15, cellheight = 12, fontsize = 10)

设定 text


热图中展示数值

# display_numbers = TRUE参数设定在每个热图格子中显示相应的数值,#number_color参数设置数值字体的颜色


pheatmap(test, display_numbers = TRUE,number_color = "blue")

image.png


# 设定数值的显示格式


pheatmap(test, display_numbers = TRUE, number_format = "%.1e")

image.png


#设定条件式展示


pheatmap(test, display_numbers = matrix(ifelse(test > 5, "*", ""), nrow(test)))

image.png


设置 legend


设定legend展示的值

#legend_breaks参数设定图例显示范围,legend_labels参数添加图例标签


pheatmap(test, cluster_row = FALSE, legend_breaks = -1:4, legend_labels = c("0", "1e-4", "1e-3", "1e-2", "1e-1", "1"))

image.png

#去掉legend


pheatmap(test, legend = FALSE)

image.png

设定 color

自定义颜色

#colorRampPalette


pheatmap(test, color = colorRampPalette(c("navy", "white", "firebrick3"))(50))

image.png

# border_color参数设定每个热图格子的边框色

# border=TRIUE/FALSE参数是否要边框线


pheatmap(test, border_color = "red", border=TRUE)

image.png

设定 annotations

# 生成行 列的注释


annotation_col = data.frame( CellType = factor(rep(c("CT1", "CT2"), 5)), Time = 1:5 )
rownames(annotation_col) = paste("Test", 1:10, sep = "")
annotation_row = data.frame( GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6))))
rownames(annotation_row) = paste("Gene", 1:20, sep = "")


#添加列的注释


pheatmap(test, annotation_col = annotation_col)

image.png


#添加行 列的注释

#angle_col 改变列标签的角度


pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row, angle_col = "45")

image.png


# 根据聚类结果,自定义注释分组及颜色


ann_colors = list( Time = c("white", "firebrick"), CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"), GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E") )
pheatmap(test, annotation_col = annotation_col,annotation_row=annotation_row, annotation_colors = ann_colors, main = "Title")

image.png

设定 gap

#根据聚类结果,设定行gap

pheatmap(test, annotation_col = annotation_col, cluster_rows =FALSE, gaps_row =c(10, 14))

image.png

#根据聚类结果,设定列gap


pheatmap(test,annotation_col = annotation_col, cluster_rows = FALSE,cutree_col = 2)

image.png

#展示行或者列的label

labels_row =c("", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "Il10", "Il15", "Il1b")

pheatmap(test, annotation_col = annotation_col, labels_row = labels_row)

image.png

热图汇总


pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row, annotation_colors = ann_colors,gaps_row = c(10, 14),cutree_col = 2,main = "Pheatmap")

image.png

输出结果


A = pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row, annotation_colors = ann_colors,gaps_row = c(10, 14),cutree_col = 2,main = "Pheatmap") #记录热图的行排序
order_row = A$tree_row$order 
 #记录热图的列排序
order_col = A$tree_col$order   
# 按照热图的顺序,重新排原始数据
result = data.frame(test[order_row,order_col])   
# 将行名加到表格数据中
result = data.frame(rownames(result),result,check.names =F)  
colnames(result)[1] = "geneid" 
#result结果按照热图中的顺序
write.table(result,file="reorder.txt",row.names=FALSE,quote = FALSE,sep='\t')  

image.png

R的当前工作目录下即可查看热图的结果。


相关文章
|
存储 编解码 数据可视化
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学中,新方法“桥接整合”允许将scATAC-seq、scDNAme等技术的数据映射到基于scRNA-seq的参考数据集,借助多组学数据作为桥梁。研究展示了如何将scATAC-seq数据集映射到人类PBMC的scRNA-seq参考,使用10x Genomics的多组学数据集。Azimuth ATAC工具提供了自动化的工作流程,支持在R和网页平台上执行桥接整合。通过加载和预处理不同数据集,映射scATAC-seq数据并进行评估,证明了映射的准确性和细胞类型预测的可靠性。此方法扩展了参考映射框架,促进了不同技术间的互操作性。
|
存储 Java 开发工具
WinServer服务器上搭建Git代码库
本文介绍如何在WinServer服务器上搭建Git代码库。
460 0
|
存储 机器学习/深度学习 算法
使用 OpenCV4 和 C++ 构建计算机视觉项目:1~5
使用 OpenCV4 和 C++ 构建计算机视觉项目:1~5
399 0
|
C++
如何使用MACS进行peak calling
MACS2是peak calling最常用的工具。 callpeak用法 这是MACS2的主要功能,因为MACS2的目的就是找peak,其他功能都是可有可无,唯独callpeak不可取代。
4539 0
|
9月前
|
人工智能 JavaScript 前端开发
【最佳实践系列】AI程序员让我变成全栈:基于阿里云百炼DeepSeek的跨语言公告系统实战
本文介绍了如何在Java开发中通过跨语言编程,利用阿里云百炼服务平台的DeepSeek大模型生成公告内容,并将其嵌入前端页面。
609 10
|
9月前
|
测试技术 API 开发者
持续上新!Qwen2.5-Max正式发布
持续上新!Qwen2.5-Max正式发布
持续上新!Qwen2.5-Max正式发布
|
数据可视化 数据挖掘 Serverless
单细胞分析(Signac): PBMC scATAC-seq 聚类
单细胞分析(Signac): PBMC scATAC-seq 聚类
|
Web App开发 移动开发 JavaScript
探索浏览器内核:理解网络世界的幕后英雄
探索浏览器内核:理解网络世界的幕后英雄
|
搜索推荐
代码分享|GPL平台没有基因注释什么办?别慌,基因ID注释万能公式!
本文介绍了处理无基因注释的GEO数据集的方法。当遇到GPL平台无基因注释时,可以通过以下步骤解决:1) 查看数据集补充文件中是否已有注释矩阵;2) 使用搜索引擎或官网查找相关资源;3) 如数据集较新,尝试联系平台官方;4) 利用已有经验进行转换。文中通过多个GSE示例详细解释了如何处理不同情况,并提醒读者注意检查数据集中可能隐藏的注释信息。作者提供了转换ID的代码,并在公众号“多线程核糖体”分享了相关资源。
2148 0
|
消息中间件 安全 Java
ulimit 命令详解
ulimit 命令详解