《从Excel到R 数据分析进阶指南》一4.3 数据分列-阿里云开发者社区

开发者社区> 异步社区> 正文

《从Excel到R 数据分析进阶指南》一4.3 数据分列

简介:
+关注继续查看

本节书摘来自异步社区《从Excel到R 数据分析进阶指南》一书中的第4章,第4.3节,作者 王彦平(蓝鲸),更多章节内容可以访问云栖社区“异步社区”公众号查看

4.3 数据分列

Excel中的数据目录下提供“分列”功能。在R中使用strsplit()函数实现分列。对于分列的操作R比Excel要复杂,下面是具体的代码,包括提取数据、转换格式和数据表合并等操作。


3e279d688cece57cf0d9770ef73aa415fcd08bb8

在数据表中category列中的数据包含有两个信息,前面的数字为类别color,后面的字母为size值。中间以连字符进行连接。我们使用strsplit()函数对这个字段进行拆分,并将拆分后的数据表匹配回原数据表中。下面是具体的代码和结果。
#数据分列
df_category<-df$category
typeof(df_category)
[1] "integer"
df_category=as.character(df_category)
typeof(df_category)
[1] "character"
df_c<-strsplit(df_category,'-')
color<- sapply(df_c, "[", 1)
size<- sapply(df_c, "[", 2)
category1=data.frame(color,size)
df=cbind(df,category1)


0d0a1722ff3be4020bfd5659001c0d9bd57c6af2

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
数据分析师的自我修养,如何进阶为数据科学家
本文讲述如何从数据分析师进阶为数据科学家。
1706 0
Hadoop大数据挖掘从入门到进阶实战
1.概述   大数据时代,数据的存储与挖掘至关重要。企业在追求高可用性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。
1626 0
SAS进阶《深入分析SAS》之数据汇总和展现
SAS进阶《深入分析SAS》之数据汇总和展现 1. 通过Print过程制作报表 proc print &lt;data=数据集&gt;; run; 选项: obs=修改观测序号列标签 noobs不显示观测序列号 id语句在输出中取代观测序列 var选择输出的变量 where语句选择输出的观测 总结如下: proc print data=数据集&lt;选项&g
1165 0
Spring Cloud进阶篇之Eureka原理分析
Spring cloud Eureka 原理介绍
1304 0
SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程
SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程 1. 所谓数据挖掘,是指通过对大量的数据进行选择、探索与建模,来揭示包含在数据中以前不为人所知的模式或规律,从而为商业活动或科学研究提供帮助和服务。 2. 数据挖掘重要的两个类别:有监督分析(SupervisedAnalysis),无监督分析(UnsupervisedAnalysis)。 有监督分析属于目标
1072 0
+关注
异步社区
异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
11940
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载