本节书摘来自异步社区《从Excel到R 数据分析进阶指南》一书中的第4章,第4.3节,作者 王彦平(蓝鲸),更多章节内容可以访问云栖社区“异步社区”公众号查看
4.3 数据分列
Excel中的数据目录下提供“分列”功能。在R中使用strsplit()函数实现分列。对于分列的操作R比Excel要复杂,下面是具体的代码,包括提取数据、转换格式和数据表合并等操作。
在数据表中category列中的数据包含有两个信息,前面的数字为类别color,后面的字母为size值。中间以连字符进行连接。我们使用strsplit()函数对这个字段进行拆分,并将拆分后的数据表匹配回原数据表中。下面是具体的代码和结果。
#数据分列
df_category<-df$category
typeof(df_category)
[1] "integer"
df_category=as.character(df_category)
typeof(df_category)
[1] "character"
df_c<-strsplit(df_category,'-')
color<- sapply(df_c, "[", 1)
size<- sapply(df_c, "[", 2)
category1=data.frame(color,size)
df=cbind(df,category1)