UpSet|多集合可视化,韦恩图?upSet!

简介: UpSet|多集合可视化,韦恩图?upSet!


介绍一个R包UpSetR,专门用来集合可视化,当多集合的韦恩图不容易看的时候,就是它大展身手的时候了。

一 载入R包 数据


#安装及加载R包
#install.packages("UpSetR")
library(UpSetR) 
#载入数据集
data <- read.csv("upSet.csv",header=TRUE)
#先大致浏览一下该数据集,数据集太长,就只看前几列
head(data,6)

二 upSet集合可视化


使用UpsetR包里面的upset()函数绘制集合可视化图形。


1. 基本参数


upset(data, 
      sets = c("Action", "Adventure", "Comedy", "Drama", "Fantasy" , "Children","Crime"),#查看特定的几个集合 
      mb.ratio = c(0.55, 0.45),#控制上方条形图以及下方点图的比例 
      order.by = "freq", #如何排序,这里freq表示从大到小排序展示 
      keep.order = TRUE, #keep.order按照sets参数的顺序排序 
      number.angles = 30, #调整柱形图上数字角度 
      point.size = 2, line.size = 1, #点和线的大小 
      mainbar.y.label = "Genre Intersections", sets.x.label = "Movies Per Genre", #坐标轴名称 
      text.scale = c(1.3, 1.3, 1, 1, 1.5, 1)) #六个数字,分别控制c(intersection size title, intersection size tick labels, set size title, set size tick labels, set names, numbers above bars)

2. queries参数

queries参数分为四个部分:query, param, color, active;
query: 指定哪个query,UpSetR有内置,也可以自定义;
param: list, query作用于哪个交集
color:每个query都是一个list,里面可以设置颜色,没设置的话将调用包里默认的调色板;
active:被指定的条形图:TRUE显示颜色,FALSE在条形图顶端显示三角形;
upset(data, main.bar.color = "black",
     queries = list(list(query = intersects,   #UpSetR 内置的intersects query
                         params = list("Drama"), ##指定作用的交集
                         color = "red", ##设置颜色,未设置会调用默认调色板
                         active = F,   # TRUE:条形图被颜色覆盖,FALSE:条形图顶端显示三角形
                         query.name = "Drama"), # 添加query图例
                    list(query = intersects,  params = list("Action", "Drama"),
                         active =T,
                         query.name = "Emotional action"),
                    list(query = intersects,  params = list("Drama", "Comedy","Action"),
                         color = "orange", active = T)),
     query.legend = "top")

可以看到 list("Drama") ,list("Action", "Drama") 和 list("Drama", "Comedy", "Action") 均根据 color 设置 显示了不同的颜色。

三 attribute.plots参数

添加属性图,内置有柱形图、散点图、热图等


3.1 添加柱形图和散点图

upset(data, main.bar.color = "black",
     queries = list(list(query = intersects, params = list("Drama"), color = "red",
                         active = F,  query.name = "Drama"),
                    list(query = intersects,  params = list("Action", "Drama"),
                         active =T,query.name = "Emotional action"),
                    list(query = intersects,  params = list("Drama", "Comedy","Action"),
                         color = "orange", active = T)),  
     attribute.plots = list(gridrows = 45, #添加属性图
                            plots = list(
                                list(plot = scatter_plot, #散点图
                                     x = "ReleaseDate", y = "AvgRating", #横纵轴的变
                                     queries = T), #T 则显示出上面queries定义的颜色
                                list(plot = histogram, x = "ReleaseDate", queries = F)),
                            ncols = 2), # 添加的图分两列
     query.legend = "top") #query图例在最上方

3.2 添加箱线图

每次最多添加两个箱线图

upset(data, boxplot.summary = c("AvgRating", "ReleaseDate"))

相关文章
|
机器学习/深度学习 自然语言处理 达摩院
Modelscope 工程介绍及实战演示| 学习笔记
快速学习 Modelscope 工程介绍及实战演示
Modelscope 工程介绍及实战演示| 学习笔记
|
Java Spring
一行解决IDEA中gradle下载依赖jar包慢问题(适用于各操作系统)
一行解决IDEA中gradle下载依赖jar包慢问题(适用于各操作系统)
2228 0
一行解决IDEA中gradle下载依赖jar包慢问题(适用于各操作系统)
|
PyTorch 算法框架/工具
MMsegmentation教程 4: 自定义模型
MMsegmentation教程 4: 自定义模型
1037 0
|
运维 前端开发 算法
开源中国【专访】 | CodeFuse:让研发变得更简单
CodeFuse 是蚂蚁集团自研的代码生成大模型,旨在简化研发流程,提供智能建议和实时支持。它能自动生成代码、添加注释、生成测试用例并优化代码。通过创新的 Rodimus 架构,CodeFuse 实现了“小体量,大能量”,显著提升了资源利用效率。其特色功能“图生代码”可将设计图一键转换为代码,准确率超过90%,大幅提高前端开发效率。此外,CodeFuse 还引入了“Code Graph”概念,帮助 LLM 更好地理解仓库级代码结构,缩短任务处理时间。未来,CodeFuse 将致力于全生命周期的研发支持,涵盖需求分析、代码生成到运维监测,推动行业技术迭代与创新。
944 3
|
存储 JavaScript API
Vue3实现图片懒加载及自定义懒加载指令
Vue3实现图片懒加载及自定义懒加载指令
1614 1
|
机器学习/深度学习 人工智能 TensorFlow
利用AI技术实现智能垃圾分类
【8月更文挑战第67天】随着人工智能技术的不断发展,越来越多的应用场景开始涌现。本文将介绍如何利用AI技术实现智能垃圾分类,通过代码示例和实际应用案例,帮助读者了解AI技术在垃圾分类领域的应用价值和潜力。
1171 19
|
前端开发 NoSQL Java
极简Markdown程序员简历模板
这是一份简洁明了的Markdown简历模板和在线编辑工具分享,适用于寻找Java工程师、前端工程师或全栈工程师职位的求职者。模板详细列出了个人信息、联系方式、技能清单及丰富的工作经验,适合用于制作专业的求职简历。
795 6
|
数据可视化 大数据 开发者
R语言中值得学习的7个可视化,附代码段&案例数据集
随着数据量的不断增加,不使用可视化来描述事例是不可能的。 数据可视化是一种将数字转化为有用知识的艺术。
13411 0
|
设计模式 人工智能 数据库
AI 驱动的开发者(MEAP)(一)(3)
AI 驱动的开发者(MEAP)(一)
394 0
|
缓存 JavaScript Shell
第7期 一文读懂NPX
第7期 一文读懂NPX
3224 0