《机器学习与数据科学(基于R的统计学习方法)》——2.6 读取Excel文件-阿里云开发者社区

开发者社区> 异步社区> 正文

《机器学习与数据科学(基于R的统计学习方法)》——2.6 读取Excel文件

简介:
+关注继续查看

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第2章,第2.6节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.6 读取Excel文件

机器学习中另一种重要的文件类型是Excel。Excel是应用很广泛的电子表格软件,各种规模的企业都依赖这个工具来存储商业信息。这样一来,你希望在机器学习中使用存放在Excel中的数据就很容易理解了。

R提供了直接从Excel 2007电子表格文件中读取数据的工具:read.xlsx()和read.xlsx2()函数。read.xlsx2()函数通常能更快地处理大型电子表格。为了测试读取Excel文件,我们需要回到San Francisco Data网站去下载同一个Parking Meters数据集,但是这一次是下载XLSX格式的数据。注意到Excel文件是一个二进制文件而不是纯文本文档,我们需要为download.file()函数指定mode=“wb”(说明文件是二进制类型)。我们还需要使用library()函数来加载xlsx包,否则使用中会找不到包中的函数。最后,为了把Excel文件读入数据框中,我们将使用read.xlsx2(),并设定参数sheetIndex=1,这指示了读入Excel文件中的哪一个表单。

> fileUrl <- "https://data.sfgov.org/api/views/7egw-qt89/rows. xlsx?accessType=DOWNLOAD"
> download.file(fileUrl, destfile="./data/SFParkingMeters.  xlsx", mode="wb")
> library(xlsx)
> SFParkingMeters <- read.xlsx2("./data/SFParkingMeters.xlsx", sheetIndex=1)```

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Python编程语言学习:如何将excel表格内的科学计数法转为常规数值并全部显示?
Python编程语言学习:如何将excel表格内的科学计数法转为常规数值并全部显示?
9 0
基于大量数据的Excel文件生成方案
基于大量数据的Excel生成方案 以往我们在基于POI生成Excel文件时,都是利用官方提供的HSSF或XSSF对应的系列API,它们操作简便,上手比较快。但是对于大数据量的Excel文件生成往往会比较耗时,这是我们利用标准的API进行开发的一个痛点。
888 0
Java Poi创建与读取Excel
Apache POI 下载 创建Excel表 public class Test { /** 存储路径 */ private static String path = "E:/Student.
700 0
poi读取excel模板,填充内容并导出,支持导出2007支持公式自动计算
/** * 版权所有(C) 2016 * @author www.xiongge.club * @date 2016-12-7 上午10:03:29 */ package xlsx; /** * @ClassName: CreateExcel * @Description: TODO() * @author www.xiongge.club *
1964 0
C#读取Excel表格中数据并返回datatable
在软件开发的过程中,经常用到从excel表格中读取数据作为数据源,以下整理了一个有效的读取excel表格的方法。   DataTable GetDataTable(string tableName,string leftTopCel,string rightbutCel) ...
1013 0
Java Poi 创建与读取Excel
Poi 包下载 创建实体Java Bean--Student public class Student { private int id; private String name; private int age; ...
753 0
C#选择多个文件并读取多个文件数据
原文:C#选择多个文件并读取多个文件数据 版权声明:本文为博主原创文章,转载请附上链接地址。 https://blog.csdn.net/ld15102891672/article/details/80586097 ...
894 0
+关注
异步社区
异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
11939
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载