开发者学堂课程【大数据之R语言速成与实战:R 基本数据管理--如何处理缺失值、日期值得使用、数据类型转换】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/363/detail/4334
R 基本数据管理--如何处理缺失值、日期值得使用、数据类型转换
内容简介:
一、如何处理缺失值-
二、日期值的使用
三、数据类型的判断及转换
四、数据排序
一、如何处理缺失值(不能用来比较)
>manager <-c(1,2,3,4,5)
>date<-c("10/24/08",'10/28/08","10/1/08","10/12/08","5/1/09")
>country <-c("US","US","UK","UK","UK")
>gender <- c("M","F","F","M","F")
>age <- c(32,45,25,39,99)
>q1<-c(5,3.3.3.2)
>q2<-c(4.5.5.,3.2)
>q3<-c
(5,2,5,4,1)
>q4<-c(5,5,5,NA,2)
>q5<-c(5,5,2,NA,1)
>survey<-data.frame(manager,date,country,gender,age,q1,q2,q3,q4, q5,stringsAsFactors=FALSE)
>
>is.na(survey[,6:10])
>survey[4,9]
>survey[4,9]==NA
>is.na(survey[4,9])
>
二、日期值的使用
> mydate <- as.Date("2016-01-20")
> mydate
[1]"2016-01-20"
>mydate1 <- c("01/05/2006","01/29/2007")
> date <- as.Date(mydatel,"%m/%d/%Y")
> date
[1]
"2006-01-05""2007-01-29"
> Sys.Date()
[1]
"2016-01-20"
> date()
[1] "wed Jan 20 21:33:51 2016"
> today<-Sys.Date()
>today
[1]"2016-01-20"
>format(today,format="%B %d %Y")
[1]"
一月 20 2016"
>format(today,format="%y")
[1]"16"
>startdate <- as.Date("2003-01-23")
>enddate<- as.Date("2011-09-18")
>days <- enddate- startdate
>days
Time difference of 3160 days
三、数据类型的判断及转换
>a<-c(2,5,7)
>a
[1]
2 5 7
> is.numeric(a)
[1]
TRUE
>b<-as.character(a)
>b
[1] "2" "5" "7"
> is.numeric(b)
[1] FALSE
is.vector(b)
[1] TRUE
>
四、数据排序
> datal <- survey[order(survey$gender,survey$age),]
> datal
> data <- survey[order(-survey$age),]
> data