UpSet|多集合韦恩图 看不太清楚咋整?用upSet吧!

简介: UpSet|多集合韦恩图 看不太清楚咋整?用upSet吧!


介绍一个R包UpSetR,专门用来集合可视化,当多集合的韦恩图不容易看的时候,就是它大展身手的时候了。


一 载入R包 数据


#安装及加载R包
#install.packages("UpSetR")
library(UpSetR) 
#载入数据集
data <- read.csv("upSet.csv",header=TRUE)
#先大致浏览一下该数据集,数据集太长,就只看前几列
head(data,6)

二 upSet集合可视化


使用UpsetR包里面的upset()函数绘制集合可视化图形。


1. 基本参数


upset(data, 
      sets = c("Action", "Adventure", "Comedy", "Drama", "Fantasy" , "Children","Crime"),#查看特定的几个集合 
      mb.ratio = c(0.55, 0.45),#控制上方条形图以及下方点图的比例 
      order.by = "freq", #如何排序,这里freq表示从大到小排序展示 
      keep.order = TRUE, #keep.order按照sets参数的顺序排序 
      number.angles = 30, #调整柱形图上数字角度 
      point.size = 2, line.size = 1, #点和线的大小 
      mainbar.y.label = "Genre Intersections", sets.x.label = "Movies Per Genre", #坐标轴名称 
      text.scale = c(1.3, 1.3, 1, 1, 1.5, 1)) #六个数字,分别控制c(intersection size title, intersection size tick labels, set size title, set size tick labels, set names, numbers above bars)

2. queries参数

queries参数分为四个部分:query, param, color, active;

query: 指定哪个query,UpSetR有内置,也可以自定义;

param: list, query作用于哪个交集

color:每个query都是一个list,里面可以设置颜色,没设置的话将调用包里默认的调色板;

active:被指定的条形图:TRUE显示颜色,FALSE在条形图顶端显示三角形;

upset(data, main.bar.color = "black",
     queries = list(list(query = intersects,   #UpSetR 内置的intersects query
                         params = list("Drama"), ##指定作用的交集
                         color = "red", ##设置颜色,未设置会调用默认调色板
                         active = F,   # TRUE:条形图被颜色覆盖,FALSE:条形图顶端显示三角形
                         query.name = "Drama"), # 添加query图例
                    list(query = intersects,  params = list("Action", "Drama"),
                         active =T,
                         query.name = "Emotional action"),
                    list(query = intersects,  params = list("Drama", "Comedy","Action"),
                         color = "orange", active = T)),
     query.legend = "top")

可以看到 list("Drama") ,list("Action", "Drama") 和 list("Drama", "Comedy", "Action") 均根据 color 设置 显示了不同的颜色。

3. attribute.plots参数

添加属性图,内置有柱形图、散点图、热图等


3.1 添加柱形图和散点图

upset(data, main.bar.color = "black",
     queries = list(list(query = intersects, params = list("Drama"), color = "red",
                         active = F,  query.name = "Drama"),
                    list(query = intersects,  params = list("Action", "Drama"),
                         active =T,query.name = "Emotional action"),
                    list(query = intersects,  params = list("Drama", "Comedy","Action"),
                         color = "orange", active = T)),  
     attribute.plots = list(gridrows = 45, #添加属性图
                            plots = list(
                                list(plot = scatter_plot, #散点图
                                     x = "ReleaseDate", y = "AvgRating", #横纵轴的变
                                     queries = T), #T 则显示出上面queries定义的颜色
                                list(plot = histogram, x = "ReleaseDate", queries = F)),
                            ncols = 2), # 添加的图分两列
     query.legend = "top") #query图例在最上方

3.2 添加箱线图

每次最多添加两个箱线图

upset(data, boxplot.summary = c("AvgRating", "ReleaseDate"))

相关文章
|
数据可视化 Go 数据库
WEGO使用—在线GO功能注释
WEGO是华大基因公司的一个在线GO注释的网站,根据网站的介绍:WEGO(网络基因本体注释图)是一个简单但有用的工具,用于可视化,比较和绘制基因本体注释结果。随着围棋词汇越来越流行,WEGO在许多研究中被广泛采用和使用,最新一次的更新是在2018年。
1055 0
|
人工智能 数据可视化 Go
R绘图实战|GSEA富集分析图
GSEA(Gene Set EnrichmentAnalysis),即基因集富集分析,它的基本思想是使用预定义的基因,将基因按照在两类样本中的差异表达程度排序,然后检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。
2923 0
R绘图实战|GSEA富集分析图
|
C++
如何使用MACS进行peak calling
MACS2是peak calling最常用的工具。 callpeak用法 这是MACS2的主要功能,因为MACS2的目的就是找peak,其他功能都是可有可无,唯独callpeak不可取代。
4215 0
|
5月前
|
文字识别 网络协议 开发工具
GitHub封锁?推荐5个国产的Git仓库替代平台
近日,GitHub对中国区IP的部分限制引发了广泛关注。未登录用户被拒,已登录用户功能受限,南北网络环境差异更显“内卷”。为应对这一挑战,本文推荐了多个国产Git平台:Gitee(码云)、GitCode(CSDN旗下)、CODING(腾讯系)、CodeUP(阿里云支持)及微信代码管理工具。这些平台功能全面、稳定性强,是开发者迁移项目的理想选择。通过同步代码、配置CI/CD流水线等简单步骤,可确保项目平稳过渡。此次事件提醒我们,掌握核心技能与支持国产平台同样重要!
2209 11
|
监控 Linux KVM
10 个最佳的 Linux 虚拟化软件,你用过哪些?
10 个最佳的 Linux 虚拟化软件,你用过哪些?
1764 0
10 个最佳的 Linux 虚拟化软件,你用过哪些?
|
设计模式 开发框架 前端开发
循序渐进介绍基于CommunityToolkit.Mvvm 和HandyControl的WPF应用端开发(6) -- 窗口控件脏数据状态IsDirty的跟踪处理
循序渐进介绍基于CommunityToolkit.Mvvm 和HandyControl的WPF应用端开发(6) -- 窗口控件脏数据状态IsDirty的跟踪处理
|
数据可视化 数据挖掘 Go
GOplot|宝藏R包,拯救你的GO富集结果,杜绝平庸的条形图
`GOplot`是R中的一个宝藏包,用于GO富集分析的创新可视化。它提供多种图表类型,如GOBar、GOBubble、GOCircle、GOChord、GOHeat和GOCluster,以及GOVenn。通过调整参数,用户可自定义颜色、大小和排序。例如,GOBar和GOBubble展示富集条形和气泡,GOCircle以环形图表示,GOChord描绘基因和过程间关系,而GOHeat和GOCluster提供热图和聚类视图。此外,还有GOVenn用于绘制Venn图。包简化了数据准备和绘图过程,适合快速高效地展示复杂分析结果。别忘了引用创始人Walter等人的工作。
1056 1
ggplot2|绘制GO富集柱形图
ggplot2|绘制GO富集柱形图
784 0
|
存储 Go
速绘丨GO富集气泡图绘制方法,利用R语言ggplot2包快速绘制,完整脚本可重复绘图
速绘丨GO富集气泡图绘制方法,利用R语言ggplot2包快速绘制,完整脚本可重复绘图
|
前端开发 JavaScript 关系型数据库
深入理解单体架构
深入理解单体架构
480 0