《机器学习与数据科学(基于R的统计学习方法)》——2.14 写数据-阿里云开发者社区

开发者社区> 异步社区> 正文

《机器学习与数据科学(基于R的统计学习方法)》——2.14 写数据

简介:
+关注继续查看

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.14节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.14 写数据

在一个机器学习项目中工作时,虽然数据科学家做的通常都是将外部文件导入R中,但有时在R环境下把数据写到外部文件中也是很有必要的。好在,我们在本章中见过的很多用于数据连接的R包都提供了写文件的功能。例如,write.table()函数能写一个CSV文件。在下面的例子中,我们将用R移除数据框的第一列(变量POST_ID),并写出一个不包含这个变量的新版CSV文件。然后,仅仅为了证明它真的有效,我们将新的CSV文件读回R中,然后使用head()来展示它的前几行。

> tempDF <- SFParkingMeters[,-1]  # Remove POST_ID variable
> write.table(tempDF, file="./data/newSFParkingMeters.csv", sep=",")
> newSFParkingMeters <- read.table("./data/newSFParkingMeters.csv", sep=",")
> head(newSFParkingMeters)
  MS_ID MS_SPACEID CAP_COLOR METER_TYPE SMART_METE ACTIVESENS JURISDICTI ON_OFF_STR
1 -     0        Grey      SS     Y       Y    SFMTA    ON
2 -     0        Green     SS     Y       Y    SFMTA    ON
3 -     0        Yellow    SS     Y       Y    SFMTA    ON
4 -     0        Grey      SS     N       N    SFMTA    ON
5 -     0        Grey      SS     N       N    SFMTA    ON
6 -     0        Grey      SS     Y       Y    SFMTA    ON

   OSP_ID STREET_NUM  STREETNAME   STREET_SEG RATEAREA  SFPARKAREA
1  0      2016      CHESTNUT ST  3977000   Area 5  Marina
2  0      2103      CHESTNUT ST  3979000   Area 5  Marina
3  0      2116      CHESTNUT ST  3979000   Area 5  Marina
4  0      525       COLUMBUS AVE 4295000   Area 3      
5  0      527       COLUMBUS AVE 4295000   Area 3       
6  0      412        HAYES ST     6816000    Area 5  Civic Center

    LOCATION
1   (37.800798, -122.43687)
2   (37.800522, -122.438067)
3   (37.800589, -122.438525)
4   (37.800053, -122.409985)
5   (37.800088, -122.410035)
6   (37.776878, -122.423512)

同样地,xlsx包的write.xlsx()函数、rjson包的toJSON()等,都能实现类似的功能。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
一文解析统计学在机器学习中的重要性
本文介绍为什么统计对于通用应用和机器学习如此重要,并大致了解各种可用的方法。
1139 0
GO学习笔记 - 数据校验
基于asaskevich/govalidator实现Golang数据校验
603 0
学习机器学习和数据科学必看的十个资源
步入寒冬,这里有份关于机器学习和数据科学学习的必看资源总结可供学习,快来瞅瞅吧。
2829 0
Spark学习之数据读取与保存(4)
Spark学习之数据读取与保存(4) 1. 文件格式 Spark对很多种文件格式的读取和保存方式都很简单。 如文本文件的非结构化的文件,如JSON的半结构化文件,如SequenceFile结构化文件。通过扩展名进行处理。 2. 读取/保存文本文件 Python中读取一个文本文件 input = sc.textfile("file:///hom
1330 0
机器学习:数据特征预处理缺失值处理
机器学习:数据特征预处理缺失值处理
7 0
机器学习:数据特征预处理归一化和标准化
机器学习:数据特征预处理归一化和标准化
15 0
+关注
异步社区
异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
12049
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载