R语言推特twitter转发可视化分析

简介: R语言推特twitter转发可视化分析

包含术语“生物信息学”的推文示例

第1步:加载所需的软件包



# 加载包

library(twitteR)


library(igraph)


library(stringr)

第2步:收集关于“生物信息学”的推文



# tweets


dm_tweets = searchTwitter("bioinformatics", n=500,)


#获取推文


dm_txt = sapply(dm_tweets, function(x) x$getText())

第3步:识别转发




# 正则表达式获取推文


grep("(RT|via)((?:\\b\\W*@\\w+)+)", dm_tweets,


ignore.case=TRUE, value=TRUE)


 


rt_patterns = grep("(RT|via)((?:\\b\\W*@\\w+)+)",


dm_txt, ignore.case=TRUE)




dm_txt[rt_patterns]

第4步:收集谁转发和谁发布

我们将使用这些结果来形成边缘列表以创建图形



# 创建列表存储信息


who_retweet = as.list(1:length(rt_patterns))


who_post = as.list(1:length(rt_patterns))


# 循环


for (i in 1:length(rt_patterns))


{


# 获取推文和转发


twit = dm_tweets[[rt_patterns[i]]]






poster = str_extract_all(twit$getText(),


"(RT|via)((?:\\b\\W*@\\w+)+)")


#删除 ':'


poster = gsub(":", "", unlist(poster))






who_post[[i]] = gsub("(RT @|via @)", "", poster, ignore.case=TRUE)


# 转发用户


who_retweet[[i]] = rep(twit$getScreenName(), length(poster))


}


# unlist


who_post = unlist(who_post)


who_retweet = unlist(who_retweet)

第5步:从编辑清单创建图形




# 边


retweeter_poster = cbind(who_retweet, who_post)


# 绘制图像


rt_graph = graph.edgelist(retweeter_poster)


# 得到点的名称


ver_labs = get.vertex.attribute(rt_graph, "name", index=V(rt_graph))

第6步:让我们绘制图




# 绘图布局


glay = layout.fruchterman.reingold(rt_graph)


# 绘制


par(bg="gray15", mar=c(1,1,1,1))


plot(rt_graph, layout=glay,


vertex.color="gray25",


vertex.size=10,


vertex.label=ver_labs,


vertex.label.family="sans",


vertex.shape="none",


vertex.label.color=hsv(h=0, s=0, v=.95, alpha=0.5),


vertex.label.cex=0.85,


edge.arrow.size=0.8,


edge.arrow.width=0.5,


edge.width=3,


edge.color=hsv(h=.95, s=1, v=.7, alpha=0.5))


# 添加标题


title("\nTweets with 'bioinformatics': Who retweets whom",


cex.main=1, col.main="gray95")


第7步:让我们试着给它一个更生物信息学的外观



#


par(bg="gray15", mar=c(1,1,1,1))


plot(rt_graph, layout=glay,


vertex.color=hsv(h=.35, s=1, v=.7, alpha=0.1),


vertex.frame.color=hsv(h=.35, s=1, v=.7, alpha=0.1),


vertex.size=5,


vertex.label=ver_labs,


vertex.label.family="mono",


vertex.label.color=hsv(h=0, s=0, v=.95, alpha=0.5),


vertex.label.cex=0.85,


edge.arrow.size=0.8,


edge.arrow.width=0.5,


edge.width=3,


edge.color=hsv(h=.35, s=1, v=.7, alpha=0.4))


# 添加标题


title("\nTweets with 'bioinformatics': Who retweets whom",


cex.main=1, col.main="gray95", family="mono")



相关文章
|
3天前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
12 0
|
2天前
|
数据采集 数据可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
|
2天前
|
数据采集 数据挖掘 测试技术
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
13 1
|
2天前
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
|
2天前
|
前端开发 数据可视化 算法
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享
12 2
|
2天前
|
算法 数据挖掘
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
|
3天前
|
机器学习/深度学习 数据可视化
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享(下)
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享
|
3天前
|
机器学习/深度学习
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享(上)
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享
10 0
|
3天前
|
机器学习/深度学习 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(下)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
|
3天前
|
机器学习/深度学习 数据采集 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(上)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
11 0

热门文章

最新文章