R语言之词云:wordcloud&wordcloud2安装及参数说明

简介: 一、wordcloud安装说明      install.packages("wordcloud");二、wordcloud2安装说明      install.packages("devtools");            devtools::install_github("lchif...

一、wordcloud安装说明

      install.packages("wordcloud");

二、wordcloud2安装说明

      install.packages("devtools");     

      devtools::install_github("lchiffon/wordcloud2",type="source") 

      错误提示:

 

      解决办法:

      install.packages("htmltools");

三、wordcloud参数说明

3.1 函数原型

 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,colors="black",ordered.colors=FALSE,use.r.layout=FALSE,...)

3.2 常用参数

1words——关键词列表

2freq——关键词对应的词频列表

3scale——字号列表。c(最大字号, 最小字号)

4min.freq——最小限制频数。低于此频数的关键词将不会被显示。

5max.words——限制词云图上关键词的数量。最后出现在词云图上的关键词数量不超过此限制。

6random.order——控制关键词在图上的排列顺序。T:关键词随机排列;F:关键词按频数从图中心位置往外降序排列,即频数大的词出现在中心位置。

7random.color——控制关键词的字体颜色。T:字体颜色随机分配;F:根据频数分配字体颜色。

8rot.per——控制关键词摆放角度。T:水平摆放;F:旋转90度。

9colors——字体颜色列表

10ordered.colors——控制字体颜色使用顺序。T:按照指定的顺序给出每个关键词字体颜色,(似乎是要求颜色列表中每个颜色一一对应关键词列表);F:任意给出字体颜色。

11use.r.layout=T;F

  四、wordcloud2参数说明

4.1 函数原型

wordcloud2(data, size = 1, minSize = 0, gridSize =  0, 

fontFamily = NULL, fontWeight = 'normal',

color = 'random-dark', backgroundColor = "white", minRotation = -pi/4, maxRotation = pi/4, rotateRatio = 0.4,  shape = 'circle', ellipticity = 0.65, widgetsize = NULL)

4.2 常用参数:

(1)data:词云生成数据,包含具体词语以及频率;

(2)size:字体大小,默认为1,一般来说该值越小,生成的形状轮廓越明显;

(3)fontFamily:字体,如‘微软雅黑’;

(4)fontWeight:字体粗细,包含‘normal’,‘bold’以及‘600’;;

(5)color:字体颜色,可以选择‘random-dark’以及‘random-light’,其实就是颜色色系;

(6)backgroundColor:背景颜色,支持R语言中的常用颜色,如‘gray’,‘blcak’,但是还支持不了更加具体的颜色选择,如‘gray20’;

(7)minRontatin与maxRontatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该范围内随机旋转;

(8)rotationRation:字体旋转比例,如设定为1,则全部词语都会发生旋转;

(9)shape:词云形状选择,默认是‘circle’,即圆形。还可以选择‘cardioid’(苹果形或心形),‘star’(星形),‘diamond’(钻石),‘triangle-forward’(三角形),‘triangle’(三角形),‘pentagon’(五边形);

 

备注:中文分词工具:

 

install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")

示例程序:

#第一步,文本分词
require(Rwordseg)
test<- readLines("E:\\FBB1.txt",encoding='UTF-8')     #读取数据
res = test[test != " "]       #读取test,且剔除test=“ ”
words = unlist(lapply(X = res,FUN = segmentCN))   #分词,并调整表结构,将有相同词频的词归类
word = lapply(X = words,FUN = strsplit," ")       #给每个词根据顺序赋个顺序指
v = table(unlist(word))               #重建表
v = sort(v,deceasing=T)           #降序排列
v[1:100]
head(v)                                           #给每列字段赋标题
d = data.frame(word = names(v),freq = v)         #更改标题
write.csv(d,"E:\\学习.csv",header = T)           #导出数据,为下一步做准备

 

 

 

 

目录
相关文章
|
8月前
|
数据采集 XML 自然语言处理
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
|
8月前
|
自然语言处理 数据可视化 大数据
R语言《红楼梦》文本挖掘:词频统计、词云可视化及前后对比分析
R语言《红楼梦》文本挖掘:词频统计、词云可视化及前后对比分析
R语言《红楼梦》文本挖掘:词频统计、词云可视化及前后对比分析
|
8月前
|
人工智能 自然语言处理 数据可视化
R语言对耐克NIKEID新浪微博数据K均值(K-MEANS)聚类文本挖掘和词云可视化
R语言对耐克NIKEID新浪微博数据K均值(K-MEANS)聚类文本挖掘和词云可视化
|
8月前
|
存储 自然语言处理 数据可视化
R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化
R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化
R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化
|
8月前
|
机器学习/深度学习 存储 算法
【数据分享】R语言SVM和LDA文本挖掘分类开源软件存储库标签数据和词云可视化
【数据分享】R语言SVM和LDA文本挖掘分类开源软件存储库标签数据和词云可视化
|
8月前
|
机器学习/深度学习 数据采集 数据可视化
R语言SVM模型文本挖掘分类研究手机评论数据词云可视化
R语言SVM模型文本挖掘分类研究手机评论数据词云可视化
|
8月前
|
机器学习/深度学习 自然语言处理 算法
数据分享|R语言聚类、文本挖掘分析虚假电商评论数据:K-MEANS(K-均值)、层次聚类、词云可视化
数据分享|R语言聚类、文本挖掘分析虚假电商评论数据:K-MEANS(K-均值)、层次聚类、词云可视化
|
8月前
|
机器学习/深度学习 自然语言处理 数据可视化
数据分享|R语言SVM支持向量机、文本挖掘新闻语料情感情绪分类和词云可视化
数据分享|R语言SVM支持向量机、文本挖掘新闻语料情感情绪分类和词云可视化
|
8月前
|
机器学习/深度学习 自然语言处理 数据可视化
数据分享|R语言豆瓣数据文本挖掘 神经网络、词云可视化和交叉验证
数据分享|R语言豆瓣数据文本挖掘 神经网络、词云可视化和交叉验证
|
8月前
|
机器学习/深度学习 自然语言处理 数据可视化
【数据分享】R语言对airbnb数据nlp文本挖掘、地理、词云可视化、回归GAM模型、交叉验证分析
【数据分享】R语言对airbnb数据nlp文本挖掘、地理、词云可视化、回归GAM模型、交叉验证分析