本节书摘来自异步社区《从Excel到R 数据分析进阶指南》一书中的第4章,第4.4节,作者 王彦平(蓝鲸),更多章节内容可以访问云栖社区“异步社区”公众号查看
4.4 数据表匹配
数据匹配是我们在经常使用的操作之一,我们这里创建一个新的数据表df2,并将df和df1两个数据表进行合并。在Excel中可以通过VLOOKUP函数实现。在R中可以通过merge()函数一次性实现。下面建立df2数据表,用于和df数据表进行合并。
df2<-data.frame(id=c(1001,1002,1003,1004,1005,1006,1007,1008),
gender=c('male','female','male','female','male','female','male','female'),
pay=c('Y','N','Y','Y','N','Y','N','Y'),
m_point=c(10,22,22,54,20,43,18,27))
使用merge函数对两个数据表进行合并,合并的方式为inner,将两个数据表中共有的数据匹配到一起生成新的数据表。
#数据表合并 inner模式
df<-merge(df,df2,by='id')
除了inner方式以外,合并的方式还有left、right和outer方式。这几种方式的差别在笔者的其他文章中有详细的说明和对比。
#数据表合并 outer模式
merge(df,df2,by='id',all=TRUE)
#数据表合并 left模式
merge(df,df2,all.x=TRUE,by='id')
#数据表合并 right模式
merge(df,df2,all.y=TRUE,by='id')