《数据科学:R语言实现》——2.9 使用twitteR

简介:

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第2章,第2.9节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.9 使用twitteR

除了可以获取社交网络交互数据,我们也可以收集Twitter上大量推文信息进行文本挖掘任务。获取Twitter数据的方法与获取Facebook的非常类似。二者都是社交平台,我们所需的只是一个访问令牌来访问内部数据。获取到访问令牌之后,我们就可以使用twitteR访问海量推文了。

准备工作

在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。

实现步骤

执行下列步骤,读取Twitter数据。

1.首先,你需要登Twitter,访问Twitter Apps页面https://apps.twitter.com/。单击Create New App,如图26所示。

2.填写所有所需的应用信息,创建新的应用,如图27所示。

image

image

3.然后,你可以选取Keys and Access Tokens,访问Application Settings,如图28所示。

image

4.单击Create my access token按键,探索器会生成一个授权的访问令牌和密钥,如图29所示。

5.安装加载twitteR程序包:

image

6.使用从Application Settings复制的用户键值和密钥,以及从Your Access Token复制的访问令牌和访问密钥,建立Twitter OAuth:
image

7.现在,你可以使用函数searchTwitter抽取前100个关于世界杯的结果:
image

运行原理

在本教程中,我们使用twitteR获取Twitter上的推文。要使用访问令牌,我们首先必须创建一个带有登录账户的应用,然后填入所需信息,完成创建。

应用创建完成之后,我们选取Keys and Access Tokens标签,在Application Settings下找到用户键值和密钥。向下滚动到Create my access token按键。单击按键之后,访问令牌和密钥会出现在Your Access Token部分。

现在,我们可以使用twitteR连接Twitter。首先,安装加载twitteR程序包。你可以从Application Settings复制用户键值和密钥,从Your Access Token复制访问令牌和密钥。复制的信息可以用来创建Twitter OAuth。最后,我们可以使用函数searchTwitter找到世界杯搜索词下的前100个搜索结果。

更多技能

类似于Facebook,Twitter也向用户提供了API测试的控制台。你可以访问API控制台 https://dev.twitter.com/rest/tools/console ,如图30所示。

image

相关文章
|
Java 程序员 云栖大会
9月20日云栖精选夜读 | 如何轻松搞定数据科学面试:Python&R语言篇
对于数据科学家来说,工作的一大部分都需要在交互式编程环境中对数据进行处理、分析和可视化。 在过去几年,R语言和Python成了进行数据科学中最炙手可热的两种语言。这两种语言各有优缺点,掌握这两种语言大有益处,但是针对面试者而言,最好的方式是学习其中一种并熟练掌握。
3088 0
|
数据挖掘 数据库 Python
【R数据科学读书笔记】R语言的数据结构原来可以这样理解
R语言的数据结构原来可以这样理解 这是R数据科学的读书笔记之一,《R数据科学》是一本教你如何用R语言进行数据分析的书。即便我使用R语言快2年多了,但是读这本书还是受益颇多。
1030 0
|
自然语言处理 数据挖掘 Unix
【R数据科学读书笔记】R语言中的管道操作
R语言中的管道操作 这是R数据科学的读书笔记之一,《R数据科学》是一本教你如何用R语言进行数据分析的书。即便我使用R语言快2年多了,但是读这本书还是受益颇多。
1187 0
|
机器学习/深度学习 Python
Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?
近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。
1181 0
|
机器学习/深度学习 大数据 物联网

热门文章

最新文章