R语言之数据导出

简介: R语言之数据导出

文章和代码已经归档至【Github仓库:https://github.com/timerring/dive-into-AI 】或者公众号【AIShareLab】回复 R语言 也可获取。

1. 导出数据

由于 R 主要用于数据分析,导入文件比导出文件更常用,但有时我们也需要将数据或分析结果导出。函数 write.table( )write.csv( ) 可以分别将数据导出到一个 .txt 文件和 .csv 文件。

此外,函数 save( ) 可以将工作空间中的指定对象保存为以 .rdata 为扩展名的 R 数据文件。例如:

ID <- 1:5
sex <- c("male", "female", "male", "female", "male")
age <- c(25, 34, 38, 28, 52)
pain <- c(1, 3, 2, 2, 3)      
pain.f <- factor(pain, levels = 1:3, labels = c("mild", "medium", "severe"))   
patients <- data.frame(ID, sex, age, pain.f)
save(patients, file = "patients.rdata")

# 导入数据
load("patients.rdata")

rdata 格式文件占用空间小,用 R 读入速度很快。因此,建议用户在导入其他格式的数据并整理好后,将其保存为 rdata 格式。要导入这种格式的数据,只需调用 load( ) 函数。

2.用 rio 包导入和导出数据

R 中的 rio 包以提供一个类似万能工具的包为目标,用统一的 import( ) 函数和 export( ) 函数简化了用户导入和导出数据的工作。此外,该包里的 convert( ) 函数可以实现不同文件格式之间的转换。rio 包支持多种文件格式,包括 SAS、SPSS、Stata、Excel、MATLAB、Minitab 等其他软件中使用的数据文件格式。

下面以 datasets 包里面的数据集 infert 为例介绍 rio 包的几个常用功能。

当你在本地加载 rio 包时,如果 R 提示有些建议安装的包没有安装,可以运行 install_formats( ) 命令进行安装。

library(rio)
data("infert")
str(infert)
# 'data.frame':    248 obs. of  8 variables:
# $ education     : Factor w/ 3 levels "0-5yrs","6-11yrs",..: 1 1 1 1 2 2 2 2 2 2 ...
# $ age           : num  26 42 39 34 35 36 23 32 21 28 ...
# $ parity        : num  6 1 6 4 3 4 1 2 1 2 ...
# $ induced       : num  1 1 2 2 1 2 0 0 0 0 ...
# $ case          : num  1 1 1 1 1 1 1 1 1 1 ...
# $ spontaneous   : num  2 0 0 0 1 1 0 0 1 0 ...
# $ stratum       : int  1 2 3 4 5 6 7 8 9 10 ...
# $ pooled.stratum: num  3 1 4 2 32 36 6 22 5 19 ...

函数 str( ) 常用于查看数据集的大小(观测的记录数及变量个数),以及各个变量的类型。从上面的输出可以看出,infert 是一个包含 248 个观测记录、每个记录有 8 个变量的数据框。

运行下面的命令将此数据框导出为 .csv 文件:

export(infert, "infert.csv")

在当前工作目录中可以找到刚才导出的名为 infert.csv 的数据文件。运行下面的命令将该文件从 .csv 文件转换成 .sav 文件:

convert("infert.csv", "infert.sav")

然后用函数 import( ) 把上面生成的 .sav 文件导入 R 中,并命名为 infert.data:

infert.data <- import("infert.sav")

比较原始的 infert 数据集和导入的 infert.data 数据集,除了第一个变量 education 的类型不一样,其余没有差别。在 R 中,as 系列函数可以用于实现变量类型的转换。

例如,这里将数据框 infert.data 中的字符型变量 education 转换为因子:

infert.data$education <- as.factor(infert.data$education)
str(infert.data$education)
# Factor w/ 3 levels "0-5 yrs","12+ yrs",..: 1 1 1 1 3 3 3 3 3 3 ...
目录
相关文章
|
3天前
|
数据可视化 JavaScript 数据挖掘
探索R语言中的数据可视化工具
【4月更文挑战第25天】本文介绍了R语言的数据可视化,重点关注ggplot2和lattice包。ggplot2基于图形语法,允许用户通过图层创建复杂图表,例如`ggplot(data, aes(x=x_variable, y=y_variable)) + geom_point()`可绘制散点图。lattice包适用于多变量数据展示,如分面散点图。此外,还提到了plotly、D3.js和shiny等其他可视化工具,以及地图绘制和热图创建技巧。掌握这些工具能帮助数据分析人员更好地理解和呈现数据。
|
5月前
|
数据挖掘 iOS开发 MacOS
Python数据分析:从导入数据到生成报告的全面指南
随着数据科学和人工智能的迅速发展,Python 已经成为了最受欢迎的数据分析语言之一。Python 具有简单易学、灵活性强、可扩展性高等优点,使其在数据分析领域具有广泛的应用。本文将介绍 Python 数据分析的基本步骤,帮助你了解如何使用 Python 进行数据分析。
|
1月前
|
JSON 数据挖掘 数据格式
python数据分析——数据分析的数据的导入和导出
数据分析的数据的导入和导出是数据分析流程中至关重要的两个环节,它们直接影响到数据分析的准确性和效率。在数据导入阶段,首先要确保数据的来源可靠、格式统一,并且能够满足分析需求。这通常涉及到数据清洗和预处理的工作,比如去除重复数据、处理缺失值、转换数据类型等,以确保数据的完整性和一致性。
36 0
|
4月前
|
数据可视化 数据挖掘 Linux
【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)
【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)
59 0
|
数据处理 Python
数据导入与预处理-第6章-04pandas综合案例(上)
数据导入与预处理-第6章-04pandas综合案例 1 pandas综合案例-运动员信息数据 1.1 查看数据 1.2 数据处理与分析
数据导入与预处理-第6章-04pandas综合案例(上)
|
数据处理 Python
数据导入与预处理-第6章-04pandas综合案例(下)
数据导入与预处理-第6章-04pandas综合案例 1 pandas综合案例-运动员信息数据 1.1 查看数据 1.2 数据处理与分析
数据导入与预处理-第6章-04pandas综合案例(下)
|
SQL JSON Oracle
数据导入与预处理-第4章-pandas数据获取(下)
数据导入与预处理-第4章-pandas数据获取 1 数据获取 1.1 概述 1.2 从CSV和TXT文件获取数据 1.2.1 读取csv案例-指定sep,encoding,engine 1.2.2 读取csv案例-names和header 1.2.3 读取csv案例-指定index_col和usecols 1.2.4 读取csv案例-指定nrows和skiprows 1.2.5 读取csv案例-指定dtype
数据导入与预处理-第4章-pandas数据获取(下)
|
存储 数据采集 JSON
数据导入与预处理-第4章-pandas数据获取(上)
数据导入与预处理-第4章-pandas数据获取 1 数据获取 1.1 概述 1.2 从CSV和TXT文件获取数据 1.2.1 读取csv案例-指定sep,encoding,engine 1.2.2 读取csv案例-names和header 1.2.3 读取csv案例-指定index_col和usecols 1.2.4 读取csv案例-指定nrows和skiprows 1.2.5 读取csv案例-指定dtype 1.2.6读取csv案例-分块读取chun
数据导入与预处理-第4章-pandas数据获取(上)
|
关系型数据库 MySQL 数据库连接
R语言学习笔记(二)导入数据
导入CSV文件 文件:G:/autompg.csv 字段: mpg:continuous cylinders:multi-valued discrete displacement:continuous horsepo...
1111 0