R语言学习笔记(二)导入数据

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 导入CSV文件文件:G:/autompg.csv字段:mpg:continuouscylinders:multi-valued discretedisplacement:continuoushorsepo...

导入CSV文件

文件:G:/autompg.csv

字段:

  1. mpg:continuous
  2. cylinders:multi-valued discrete
  3. displacement:continuous
  4. horsepower
  5. weight:continuous
  6. acceleration:continuous
  7. model year:multi-valued discrete
  8. origin:multi-valued discrete
  9. car name:string (unique for each instance)

读取文件:

if(FALSE){stringsAsFactors=FALSE读取字符串变量}
auto_mpg <- read.table("G:/autompg.csv", header=TRUE, sep=',',stringsAsFactors=FALSE,quote = "")
summary(auto_mpg)

输出为:(与实际表格的字段类型不符)
这里写图片描述

用colClasses为每一列指定一个类,例如logical(逻辑型)、numeric(数值型)、character(字符型)、factor(因子)。

auto_mpg <- read.table("G:/autompg.csv",colClasses=c("numeric","factor","numeric","numeric","numeric","numeric","factor","factor","character") ,header=TRUE, sep=',',quote = "")
summary(auto_mpg)
if(FALSE){查看前5行}
auto_mpg[1:5,]

输出结果为:
这里写图片描述

导入EXCEL文件

1.将EXCEL文件转化为CSV文件,再导入CSV文件(最佳方式)

2.利用xlsx包或者RODBC包导入数据

if(FALSE){安装xlsxC包}
install.packages("xlsx")
if(FALSE){读取autompg.xlsx的第一页表}
library(xlsx)
mydata <- read.xlsx("G:/autompg.xlsx", 1)

这将又会出现导入CSV文件的问题,即导入的数据类型与原来数据类型不一致。

导入数据库表格

在R中通过RODBC包访问一个数据库也许是最流行的方式,这种方式允许R连接到任意一种拥有ODBC驱动的数据库,其实几乎就是市面上的所有数据库。

以导入MySQL数据库数据表为例。前提是你的电脑上已经安装了MySQL的ODBC驱动程序,网址为https://dev.mysql.com/downloads/connector/odbc/.
这里写图片描述
安装完MySQL的ODBC驱动后,打开控制面板的管理工具,根据自己的Windows系统版本打开ODBC数据源。再连接到MySQL数据库,我们以访问test数据库为例,数据源名称为connect_mysql.
这里写图片描述
这样设置完后,我们就可以利用R语言连接数据库了(注意:这是双向的连接)。

library(RODBC)
if(FLASE){连接数据库,账号为root,密码为123456}
myconn <-odbcConnect("connect_mysql",uid="root",pwd="123456")
if(FALSE){连接该数据库的product表格}
mysqldata <- sqlFetch(myconn, "product")

对数据库的操作

library(RODBC)
if(FALSE){连接数据库+账号为root+密码为123456}
myconn <-odbcConnect("connect_mysql",uid="root",pwd="123456")
if(FALSE){连接该数据库的product表格+并查看前5行}
mysqldata <- sqlFetch(myconn, "product")
print(mysqldata[1:5,])
if(FALSE){对product表进行SQL查询}
print(sqlQuery(myconn, "select * from product where maker ='E'"))
print(sqlQuery(myconn, "select maker,max(model) as max_model from product group by maker"))
if(FALSE){关闭连接}
close(myconn)

这里写图片描述

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
自然语言处理 数据挖掘 Unix
R 语言是什么、R 的优势、资源|学习笔记
快速学习 R 语言是什么、R 的优势、资源。
116 0
R 语言是什么、R 的优势、资源|学习笔记
应用统计学与R语言实现学习笔记(六)——假设检验
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/71420125 Chapter 6 Hypothesis Test 本篇是第6章,内容是假设检验。
1274 0
|
自然语言处理 数据挖掘 大数据
R 语言是什么、R 的优势、资源 | 学习笔记
快速学习 R 语言是什么、R的优势、资源
124 0
R语言学习笔记(一)数据结构
使用软件:RStudio, RGUI R的数据类型: - 数值型Numeric,如100,0,-4.335 - 字符型Character,如“China” - 逻辑性Logical,如TRUE,FALSE - 复数...
931 0
|
JavaScript
应用统计学与R语言实现学习笔记后记
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/78189125 1 后记 应用统计学与R语言实现学习笔记这一系列博客断断续续写了5个月左右。
1331 0
|
供应链
应用统计学与R语言实现学习笔记(十四)——案例与实践
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/78177826 Chapter 14 Case and Practice 本篇是第十四章,内容是案例与实践。
1666 0
|
资源调度
应用统计学与R语言实现学习笔记(十三)——因子分析
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/78166545 Chapter 13 Factor Analysis 本篇是第十三章,内容是因子分析。
1410 0
|
资源调度
应用统计学与R语言实现学习笔记(十二)——主成分分析
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/78062883 Chapter 12 Priciple Component Analysis 本篇是第十二章,内容是主成分分析。
1158 0
|
资源调度 关系型数据库
应用统计学与R语言实现学习笔记(十一)——判别分析
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/77938432 Chapter 11 Discriminant Analysis 笔者最近任务繁重,断更了一顿时间,最近会开始慢慢把这个系列写完。
1166 0
|
资源调度 数据挖掘 关系型数据库
应用统计学与R语言实现学习笔记(十)——聚类分析
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/73554709 Chapter 10 Cluster Analysis 本篇是第十章,内容是聚类分析。
1161 0