《机器学习与数据科学(基于R的统计学习方法)》——1.9 数据集-阿里云开发者社区

开发者社区> 异步社区> 正文

《机器学习与数据科学(基于R的统计学习方法)》——1.9 数据集

简介:
+关注继续查看

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.9节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.9 数据集

本书尽力教大家机器学习的方法,因为机器学习是关于数据的,所以我们需要大量的样本数据集以供在例子中使用。为了让事情简单一点(并且不需要你花费大量时间去寻找数据集),书中使用的大多数数据集都是R软件在安装时自带的。使用如下命令,查看可用的数据集列表:

> data()```
你所能看到的列出的数据集,取决于你安装了什么包和你在内存中加载了什么包。R包中通常包含可以用来检验函数功能的数据集。可以使用如下命令,查看特定R包中包含的数据集:

data(package="plyr")`
要查看某个数据集中的更多内容,你可以使用在数据集名称前面加?的命令,就像下面展示的这样。R会给出数据集的简短介绍、观测(例子)的数目、变量名(特征)列表、代码示例和在很多情况下都有的每个变量的描述。图1-5展示了R给出的关于airquality数据集的帮助信息。本书会使用许多著名数据集,强烈建议你熟悉每个数据集中的每个变量。

> ? airquality```
你可以使用以下命令来将某个数据集加载到内存中:

data(iris)`

你将在RStudio的Workspace标签页看到数据集的名称。

df3569153bccdba082a347135a3cc32526c4637a

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
干货|如何让机器向“时尚达人”学习?阿里做了个“实用”的图像数据集
阿里资深算法专家雷音带领的团队,有个非常特别的名字,叫做“图像与美”。雷音希望,未来AI产品对衣服的理解不只限于照片和文字,还可以理解衣服本身,进而理解时尚穿搭之道、理解流行风向。
873 0
Python学习十大公开免费数据集介绍
很多行友说,想做项目学习和练手没有数据怎么办。又想给行哥投稿赚钱,没有数据拿头分析啊。先别急,这里行哥给大家推荐一些数据来源,足够你去好好分析数据,这些数据用来学习和找工作都不是问题
13 0
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
6908 0
客户端和服务器的通信程序|学习笔记
快速学习客户端和服务器的通信程序
25 0
独家 | ARIMA/Sarima与LSTM的时间序列数据集成学习(附链接)
本文探讨了简单的ARIMA/Sarima与LSTM的时间序列数据集成学习方面的问题。
1536 0
SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 KEEP 规定在数据集中保留的变量 DROP 规定在数据集中删除的变量 ARRAY 定义一个数组 RENAME
1387 0
[学习日记]对SOAP请求的头添加内容的方法
方法主要是利用类的继承继承WEB服务的代理类,然后添加新的方法,实现对SOAP请求信封的头内添加信息。以下是生成的继类的代码,继承类的名为GetHttpHeadersProxy.vb Imports System.
554 0
+关注
异步社区
异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
11939
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载