R语言推特twitter网络转发可视化分析

简介: R语言推特twitter网络转发可视化分析

包含关键词“生物信息学”的推文示例

第1步:加载所需的软件包



# 加载所需的软件包





library(igraph)

第2步:收集关于“生物信息学”的推文



# 包含“生物信息学”的英语推文

dm_tweets = searchTwitter("bioinformatics", n=500,)


# 得到文本



dm_txt = sapply(dm_tweets, function(x) x$getText())

第3步:识别转发

# 查找转发的正则表达式



grep("(RT|via)((?:\\b\\W*@\\w+)+)", dm_tweets,




# 哪些推文是转发推文



rt_patterns = grep("(RT|via)((?:\\b\\W*@\\w+)+)",


dm_txt, ignore.case=TRUE)


# 显示转发(这些是我们要关注的转发)



dm_txt[rt_patterns]


第4步:收集谁转发和谁发布

我们将使用这些结果来形成边列表以创建图形



# 创建列表以存储用户名


who_retweet = as.list(1:length(rt_patterns))




# for循环


for (i in 1:length(rt_patterns))


{


# 通过转发实体获取消息


twit = dm_tweets[[rt_patterns[i]]]


# 获取转推源


poster = str_extract_all(twit$getText(),


"(RT|via)((?:\\b\\W*@\\w+)+)")


#删除':'



poster = gsub(":", "", unlist(poster))


# 转推的用户名


who_post[[i]] = gsub("(RT @|via @)", "", poster, ignore.case=TRUE)


# 转推用户名


who_retweet[[i]] = rep(twit$getScreenName(), length(poster))






# 转换列表为向量格式


who_post = unlist(who_post)



第5步: 从编辑清单创建图形

# 两列边矩阵



retweeter_poster = cbind(who_retweet, who_post)


# 产生图



rt_graph = graph.edgelist(retweeter_poster)


# 获取点名称



ver_labs = get.vertex.attribute(rt_graph, "name", index=V(rt_graph))

第6步: 让我们绘制图



# 选择绘图布局



glay = layout.fruchterman.reingold(rt_graph)


# 绘图



par(bg="gray15", mar=c(1,1,1,1))


plot(rt_graph, layout=glay,




vertex.label.color=hsv(h=0, s=0, v=.95, alpha=0.5),




edge.width=3,


edge.color=hsv(h=.95, s=1, v=.7, alpha=0.5))


# 添加标题



title("\nTweets with 'bioinformatics': Who retweets whom",


cex.main=1, col.main="gray95")

第7步:生物信息学表示



# 绘制另外一个图



par(bg="gray15", mar=c(1,1,1,1))


plot(rt_graph, layout=glay,




edge.color=hsv(h=.35, s=1, v=.7, alpha=0.4))


# 添加标题



title("Tweets with 'bioinformatics': Who retweets whom",


cex.main=1, col.main="gray95", family="mono")


 


相关文章
|
1月前
|
人工智能 边缘计算 物联网
蜂窝网络未来发展趋势的分析
蜂窝网络未来发展趋势的分析
67 2
|
1月前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
2月前
|
机器学习/深度学习 数据可视化 计算机视觉
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
67 1
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
|
2月前
|
机器学习/深度学习 数据采集 存储
时间序列预测新突破:深入解析循环神经网络(RNN)在金融数据分析中的应用
【10月更文挑战第7天】时间序列预测是数据科学领域的一个重要课题,特别是在金融行业中。准确的时间序列预测能够帮助投资者做出更明智的决策,比如股票价格预测、汇率变动预测等。近年来,随着深度学习技术的发展,尤其是循环神经网络(Recurrent Neural Networks, RNNs)及其变体如长短期记忆网络(LSTM)和门控循环单元(GRU),在处理时间序列数据方面展现出了巨大的潜力。本文将探讨RNN的基本概念,并通过具体的代码示例展示如何使用这些模型来进行金融数据分析。
370 2
|
2月前
|
机器学习/深度学习 数据可视化 Windows
深度学习笔记(七):如何用Mxnet来将神经网络可视化
这篇文章介绍了如何使用Mxnet框架来实现神经网络的可视化,包括环境依赖的安装、具体的代码实现以及运行结果的展示。
57 0
|
3月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
2天前
|
安全 网络协议 网络安全
网络不稳定导致HTTP代理频繁掉线的分析
随着数字化时代的加速发展,网络安全、隐私保护及内容访问自由成为用户核心需求。HTTP代理服务器因其独特技术优势受到青睐,但其掉线问题频发。本文分析了HTTP代理服务器不稳定导致掉线的主要原因,包括网络问题、服务器质量、用户配置错误及IP资源问题等方面。
18 0
|
27天前
|
安全 网络协议 网络安全
【Azure 环境】从网络包中分析出TLS加密套件信息
An TLS 1.2 connection request was received from a remote client application, but non of the cipher suites supported by the client application are supported by the server. The connection request has failed. 从远程客户端应用程序收到 TLS 1.2 连接请求,但服务器不支持客户端应用程序支持的任何密码套件。连接请求失败。
|
1月前
|
存储 安全 网络安全
网络安全法律框架:全球视角下的合规性分析
网络安全法律框架:全球视角下的合规性分析
45 1
|
1月前
|
网络协议 安全 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
实战:WireShark 抓包及快速定位数据包技巧、使用 WireShark 对常用协议抓包并分析原理 、WireShark 抓包解决服务器被黑上不了网等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
下一篇
DataWorks