R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

2024-04-28 252

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

全文链接：http://tecdat.cn/?p=31585

Google Trends，即谷歌趋势。谷歌趋势是谷歌旗下一款基于搜索数据推出的一款分析工具（点击文末“阅读原文”获取完整代码数据）。

它通过分析谷歌搜索引擎每天数十亿的搜索数据，告诉用户某一关键词或者话题各个时期下在谷歌搜索引擎中展示的频率及其相关统计数据。

我们为一位客户进行了短暂的咨询工作，他正在构建一个主要基于谷歌搜索词热度和就业率的分析应用程序。

思路是这样的：用本科就业人数employed-bachelor的数据除以总就业人数employed-all的数据，得出百分比，即本科就业率。

然后把关键词“性别平等”（gender equality）的谷歌趋势google trend的数据整合成月的，两个数据做成一个表格，然后作pearson correlation相关性的分析，和可视化：

读取数据

employedall=read.csv("employed-all.csv")  
employed_bachelor=read.csv("employed-bachelor.csv")  
google=read.csv("gender equality- google trend.csv",skip=4)

点击标题查阅往期内容

R语言淮河流域水库水质数据相关性分析、地理可视化、广义相加模型GAM调查报告

合并数据

把google trend的数据整合成月的

for(j in c("01","02","03","04","05","06","07","08","09","10","11","12")){  
  ym=paste(i,"-",j,sep="")  
    index=grep(ym, google$Week )  
    monthsum=c(monthsum,sum(as.numeric(google$gender.equality[index])))

合并google trend的数据和就业数据

result=cbind(monthsum,employed$proportion)

分析相关性可视化

Pearson's相关性检验

在统计学中，皮尔逊相关系数，是用于度量两个变量X和Y之间的相关（线性相关），其值介于-1与1之间，其绝对值越大说明该两个变量越相关。

cor.test(result$employed,result$google)

首先看Y与X是否有显著关系，即P值大小，接着分析相关关系为正向或负向，也可通过相关系数大小说明关系紧密程度。一般相关系数在0.7以上说明关系非常紧密。p<0.01，因而说明本科就业率和性别平等搜索热度之间有着显著的正相关关系。

R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

全文链接：http://tecdat.cn/?p=31585

读取数据

合并数据

把google trend的数据整合成月的

合并google trend的数据和就业数据

分析相关性可视化

Pearson's相关性检验

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

全文链接：http://tecdat.cn/?p=31585

读取数据

合并数据

把google trend的数据整合成月的

合并google trend的数据和就业数据

分析相关性可视化

Pearson's相关性检验

热门文章

最新文章

相关课程

相关电子书

推荐镜像