R语言数据可视化-词云图

简介: R语言数据可视化-词云图

一、概述



640.png


当看到这种图的时候,你一定会在猜这个是怎么做出来的,然后有什么用?


「词云图」是用来展示文本中词语的频率及权重分布的一种可视化方式,其中出现频率较高的词语会以较大的字体大小显示,而权重较低的词语则会以较小的字体大小显示。


二、 数据集



2.1 安装和加载包


wordcloud2 可以根据不同的词语权重自定义字体大小、颜色和布局模式,并且支持更加灵活的配置选项,使得生成的词云图更加精美和逼真。自带数据集「demoFreqC」


install.packages("wordcloud2") # 安装包
library(wordcloud2) # 加载包


2.2 数据集展示


加载数据集

data(demoFreqC)
head(demoFreqC)


数据集展示

V2   V1
1     数据 2304
3     统计 1413
4     用户  855
5     模型  846
7     分析  773
8 数据分析  750


三、使用方法



3.1 简单词云图


wordcloud2(demoFreqC)

640.png


3.2 参数介绍


wordcloud2(data, size = 1, minSize = 0, gridSize =  0,
    fontFamily = 'Segoe UI', fontWeight = 'bold',
    color = 'random-dark', backgroundColor = "white",
    minRotation = -pi/4, maxRotation = pi/4, shuffle = TRUE,
    rotateRatio = 0.4, shape = 'circle', ellipticity = 0.65,
    widgetsize = NULL, figPath = NULL, hoverFunction = NULL)
参数
data 包含每列中的单词和频率的数据框
size 字体大小,默认值为 1。尺寸越大意味着单词越大。
minSize 字幕的字符串
gridSize  网格的大小(以像素为单位),用于标记画布的可用性 网格大小越大,单词之间的差距越大。
fontFamily 要使用的字体。
fontWeight  要使用的字体粗细,例如普通、粗体或 600
color  可以使用文本的颜色,关键字“随机暗”和“随机光”。 此参数中也支持颜色矢量
backgroundColor 背景的颜色。
minRotation  如果单词应旋转,则最小旋转 (以 rad 为单位)文本应旋转。
maxRotation  如果单词应旋转,则文本应旋转的最大旋转(以 rad 为单位)。 将两个值设置为相等,以使所有文本保持一个角度。
shuffle  随机播放要绘制的点,以便每次相同的列表和设置的结果都会有所不同。
rotateRatio  单词旋转的概率。将数字设置为 1 以始终旋转。
shape 要绘制的“云”的形状。可以是存在的关键字。可用的礼物是“圆圈” (默认),“心形”(苹果形或心形曲线,最著名的极性方程), “菱形”(正方形的别名)、“三角形”、“三角形”、“五边形”和“星形”。
ellipticity  形状词云2的“平坦度”程度.js应该画出来。
widgetsize 小部件的大小
figPath 用作蒙版的图形的路径。
hoverFunction  光标进入或离开占用区域时调用的回调 一句话。一个字符串的 java 脚本函数。


  1. 「修改字体大小」

wordcloud2(demoFreqC, size = 2)


640.png


如果不设置size,则默认为1,现在设置成了2,词云图字明显变大。


  1. 「调整形状」
wordcloud2(demoFreqC, shape = 'cardioid',size=1.5)


640.png


默认为'circle', 其他形状有:

  • 'cardioid'(心形,也是最受欢迎的形状)
  • 'diamond' (钻石形状)
  • 'triangle-forward'(朝前的三角形)
  • 'triangle'(三角形)
  • 'pentagon'(五边形)
  • 'star'(星形)


  1. 「修改背景色」


wordcloud2(demoFreqC, size = 1.5,shape="pentagon",
           color = "random-dark", backgroundColor = "darkgrey")

640.png


  • 图的颜色使用color调整,可用值有'random-dark''random-light'两种,也支持其他颜色调整。
  • 背景的颜色使用backgroundColor参数调整。


  1. 「旋转角度」
wordcloud2(demoFreqC,
           size = 1.5,
           shape = "star",
           minRotation = 30, maxRotation = 45,
           rotateRatio = 1)

640.png


5. 「主题设置」

wordcloud2(demoFreqC,size=1.5,shape="cardioid") + WCtheme(1) + WCtheme(2) + WCtheme(3)


640.png


目录
相关文章
|
3月前
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
128 3
|
8月前
|
数据可视化 算法 大数据
数据分享|R语言改进Apriori关联规则挖掘研究西安PM2.5含量与天气因素关系数据可视化
数据分享|R语言改进Apriori关联规则挖掘研究西安PM2.5含量与天气因素关系数据可视化
|
5月前
|
数据可视化
R语言可视化设计原则:打造吸引力十足的数据可视化
【8月更文挑战第30天】R语言可视化设计是一个综合性的过程,需要综合运用多个设计原则来创作出吸引力十足的作品。通过明确目标、选择合适的图表类型、合理运用色彩与视觉层次、明确标注与引导视线以及引入互动性与动态效果等原则的应用,你可以显著提升你的数据可视化作品的吸引力和实用性。希望本文能为你提供一些有益的启示和帮助。
|
8月前
|
数据可视化 数据挖掘 索引
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码2
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
8月前
|
数据可视化 定位技术
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
|
8月前
|
机器学习/深度学习 数据可视化 算法
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
|
8月前
|
监控 数据可视化 数据挖掘
R语言质量控制图、质量管理研究分析采购订单数量、CPU时间、纸厂产出、钢板数据可视化
R语言质量控制图、质量管理研究分析采购订单数量、CPU时间、纸厂产出、钢板数据可视化
|
8月前
|
存储 数据可视化 数据挖掘
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码1
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
8月前
|
数据可视化
R语言平稳性ADF检验、ARCH-LM效应检验分析收盘价收益率数据可视化
R语言平稳性ADF检验、ARCH-LM效应检验分析收盘价收益率数据可视化
|
8月前
|
数据可视化
R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化
R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化