DataFrame合并和连接的案例解析如下:
首先,我们需要导入pandas库,并创建两个DataFrame。
import pandas as pd
data1 = {
'姓名': ['张三', '李四', '王五'],
'年龄': [25, 30, 35],
'城市': ['北京', '上海', '深圳']
}
data2 = {
'姓名': ['赵六', '孙七', '周八'],
'性别': ['男', '女', '男'],
'职业': ['教师', '医生', '律师']
}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
print(df1)
print(df2)
输出结果:
姓名 年龄 城市
0 张三 25 北京
1 李四 30 上海
2 王五 35 深圳
姓名 性别 职业
0 赵六 男 教师
1 孙七 女 医生
2 周八 男 律师
接下来,我们可以使用pandas的merge()方法将两个DataFrame合并。例如,我们可以根据姓名列将它们合并。
merged_data = pd.merge(df1, df2, on='姓名')
print(merged_data)
输出结果:
姓名 年龄 城市 性别 职业
0 张三 25 北京 男 教师
1 李四 30 上海 女 医生
2 王五 35 深圳 男 律师
我们还可以使用pandas的concat()方法将两个DataFrame连接。例如,我们可以将它们垂直堆叠在一起。
concatenated_data = pd.concat([df1, df2], axis=0)
print(concatenated_data)
输出结果:
姓名 年龄 城市 性别 职业
0 张三 25 北京 男 教师
1 李四 30 上海 女 医生
2 王五 35 深圳 男 律师
3 赵六 NaN NaN NaN NaN
4 孙七 NaN NaN NaN NaN
5 周八 NaN NaN NaN NaN
这样,我们就完成了DataFrame的合并和连接操作。