R-rbind.fill|列数不一致的多个数据集“智能”合并,Get!

简介: R-rbind.fill|列数不一致的多个数据集“智能”合并,Get!

本文首发于“生信补给站”公众号  https://mp.weixin.qq.com/s/aUdleBXDwUUpxGOONllyiA


Q:多个数据集,列数不一致,列名也不一致,如何按行合并,然后保留全部文件的变量并集呢?

A:使用 rbind.fill 函数试试!


数据集按列合并时,可以根据merge 或者 dplyr函数包的merge系列函数决定连接方式,达到数据合并的需求。

但是按行合并时常用的rbind,限制条件有点多,发现plyr包的rbind.fill 函数能比较好的解决这个问题。

一 生成数据

#生成随机数据
data1<- data.frame(x1=runif(5),x2= runif(5),x3= runif(5))
data2<- data.frame(x1=rnorm(5),x4= runif(5))
data3<- data.frame(x3=rnorm(5),x5= rnorm(5))

data1,data2,data3 列数不一致,列名也不一致,现在需要按行合并,可能的问题:

1)rbind: 是根据行进行合并(行叠加)但是要求rbind(a, c)中矩阵a、c的列数必需相等。

2)列数相同的时候,变量名不一致也会合并,导致出错

二 rbind.fill“智能”合并

列数不一致多个数据集,需要按行合并,尝试使用plyr包rbind.fill函数

library(plyr)
rbind.fill(data1,data2,data3)

呐,就是这样,rbind.fill函数会自动对应数据列名不存在的会补充列,缺失时NA填充。

相关文章
|
13天前
表格数据填充方法
【10月更文挑战第22天】表格数据填充方法
19 2
|
3月前
|
数据挖掘 索引 Python
数据分析缺失值处理(Missing Values)——删除法、填充法、插值法
数据分析缺失值处理(Missing Values)——删除法、填充法、插值法
75 2
|
6月前
|
数据采集 数据挖掘 数据处理
DataFrame 的缺失值处理:填充、删除与插值
【5月更文挑战第19天】DataFrame数据处理中,面对缺失值问题,常用方法包括填充(如固定值、平均值)和删除。插值是一种有效手段,如线性插值适合时间序列数据。根据数据特性和分析目标,可组合使用多种方法,如先填充再插值。灵活应用这些策略能提升数据质量和分析准确性,为决策提供可靠支持。
254 2
|
6月前
|
Java Apache 索引
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
909 0
|
6月前
【合并单元格】纵向合并单元格之前对数组处理【针对饿了么element的table的span-method合并行或列的计算方法】
【合并单元格】纵向合并单元格之前对数组处理【针对饿了么element的table的span-method合并行或列的计算方法】
|
6月前
GEE——土地利用分类种两个矢量集合中不同列进行相减的方式(利用join进行连接处理)
GEE——土地利用分类种两个矢量集合中不同列进行相减的方式(利用join进行连接处理)
75 2
|
6月前
|
定位技术 Python
Python中ArcPy栅格裁剪栅格:批量对齐栅格图像范围并统一行数与列数
Python中ArcPy栅格裁剪栅格:批量对齐栅格图像范围并统一行数与列数
141 1
|
6月前
|
存储 定位技术 计算机视觉
Python中ArcPy实现多张栅格遥感影像无效值NoData批量填充
Python中ArcPy实现多张栅格遥感影像无效值NoData批量填充
|
计算机视觉
opencv 之图像的边界填充及一些数据计算
opencv 之图像的边界填充及一些数据计算
108 0
ENVI按行数、列数或像元个数裁剪栅格图像
本文介绍基于ENVI软件,实现栅格遥感影像按照像元行列号与个数进行指定矩形区域裁剪的方法~
227 1
ENVI按行数、列数或像元个数裁剪栅格图像