《数据科学:R语言实现》——2.3 读取和写入CSV文件

简介:

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第2章,第2.3节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 读取和写入CSV文件

在之前的教程中,我们从雅虎财经下载了标普500历史价格数据。现在我们可以读取数据,并加载到R进程中,以备后续查看和操作。在本教程中,我们会介绍如何使用R函数读取文件。

准备工作

在本教程中,你需要完成之前的教程,并把标普500历史价格文本文件下载到当前目录。

实现步骤

执行下列步骤,从CSV文件中读取文本数据。

1.首先,使用getwd确定当前目录,使用list.files查看文件的位置:
image

2.然后,使用函数read.table指定逗号为分隔符,读取数据:
image

3.接着,选取前6行,并且列为Date,Open,High,Low和Close的数据:
image

4.使用函数head查看加载的前6行数据:
image

5.因为文件以CSV格式加载,也可以使用read.csv读取文件:
image

运行原理

通过之前教程的学习,你应该已经把雅虎财经数据下载到当前目录了。因为下载的数据以表的形式组织,你可以使用函数read.table来读取文件中的数据,并加载到R的数据框中。

由于下载的数据使用逗号分隔并包含列名,你可以在函数参数中设定header等于TRUE,“,”为分隔符。读取snp500.csv到stock_data数据框后,你可以选取数据的前6行,并使用函数head进一步查看。

与函数read.table类似,你也可以使用read.csv读取文本文件。read.table和read.csv的唯一不同是,read.csv使用逗号作为默认分隔符来读取文件,而read.table使用空格作为默认分隔符。你可以使用函数head查看加载的数据框。

更多技能

在刚才的介绍中,我们介绍了如何使用RCurl获取纽约市公开数据网站的Wi-Fi热点数据。由于下载的数据是字符向量,我们可以在函数参数中设定text等于字符向量rows,使用read.csv读取文件到R进程中:

image

相关文章
|
4月前
|
XML 数据格式 Windows
如何从xml文件创建R语言数据框dataframe
如何从xml文件创建R语言数据框dataframe
|
4天前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
3月前
|
Python
R语言遍历文件夹求取其中所有栅格文件的平均值
通过NAvalue(tif_file_all) <- -10000这句代码,将值为-10000的像元作为NoData值的像元,防止后期计算平均值时对结果加以干扰。   接下来,我们通过file.path()函数配置一下输出结果的路径——其中,结果遥感影像文件的名称就可以直接以其所对应的条带号来设置,并在条带号后添加一个_mean后缀,表明这个是平均值的结果图像;但此外,这个仅仅是文件的名字,还需要将文件名与路径拼接在一起,才可以成为完整的保存路径,因此需要用到file.path()函数。最后,将结果图像通过writeRaster()函数加以保存即可,这句代码的解释大家同样参考R语言求取大量遥感
164 0
|
4月前
|
存储 编解码 定位技术
R语言读取大型NetCDF文件
失踪人口回归,本篇来介绍下R语言读取大型NetCDF文件的一些实践。
111 4
|
存储 算法 Linux
算法丨根据基因型VCF文件自动识别变异位点并生成序列fasta文件,基于R语言tidyverse
算法丨根据基因型VCF文件自动识别变异位点并生成序列fasta文件,基于R语言tidyverse
|
XML JSON 关系型数据库
R语言笔记丨数据储存文件的类型与介绍
R语言笔记丨数据储存文件的类型与介绍
|
Linux 测试技术 数据处理
R语言丨根据VCF文件设计引物,自动识别两样本差异SNP位点,调用samtools获取上下游参考序列,快速得到引物序列
R语言丨根据VCF文件设计引物,自动识别两样本差异SNP位点,调用samtools获取上下游参考序列,快速得到引物序列
|
算法 Linux Python
SGAT丨基于R语言tidyverse的vcf转txt文件算法,SNP位点判断与自动校正,染色体格式替换
SGAT丨基于R语言tidyverse的vcf转txt文件算法,SNP位点判断与自动校正,染色体格式替换
|
数据采集 数据可视化
揭秘水文覆盖变化!使用 R 语言轻松处理 MODIS .nc 文件
GRACE水文数据包括地表水蓄积(SWS)、土壤水蓄积(SSS)、总水蓄积(TWS)等变量,通常以每月为单位进行统计和融合,并以网格的形式提供各个区域的数据。 在这里,我们将通过使用 R 语言及其相关包对 GRACE 数据进行研究。具体来说,我们将使用 ncdf4 包读取 GRACE 的 .nc 数据,并进行数据的预处理和可视化分析。
142 0
|
Unix Linux
R语言-文件归档压缩方法
本文简单分享了一种在 R语言 中压缩文件的实现方法,以供参考学习
546 0
R语言-文件归档压缩方法