《从Excel到R 数据分析进阶指南》一3.5 删除重复值-阿里云开发者社区

开发者社区> 大数据> 正文
登录阅读全文

《从Excel到R 数据分析进阶指南》一3.5 删除重复值

简介:

本节书摘来自异步社区《从Excel到R 数据分析进阶指南》一书中的第3章,第3.5节,作者 王彦平(蓝鲸),更多章节内容可以访问云栖社区“异步社区”公众号查看

3.5 删除重复值

很多数据表中还包含重复值的问题。Excel的数据目录下有“删除重复项”的功能,可以用来删除数据表中的重复值。默认Excel会保留最先出现的数据,删除后面重复出现的数据。


2adeecc89f64d936d81410c38a44e4ff7d0a08af

R中使用duplicated()函数查找重复值。duplicated()函数既可以查找数据表的重复值,也可以查找特定列中的重复值。发现重复值后使用unique()函数删除重复值。下面是具体的代码和比较结果。

#查找数据表重复值
duplicated(df)

#查找特定列的重复值
duplicated(df$city)

#查看数据表的唯一值(删除重复值)
df<-unique(df)


21e73f7deebac7946c1c5e8495c6893553c553f3

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据
使用钉钉扫一扫加入圈子
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

其他文章
最新文章
相关文章