在现实生活中,都会存在不同的表,但表之间有相互关系,我们需要进行整理,进行连接,这种过程类似于数据库的连接。
我们先构造用户和订单的dataframe:
import pandas as pd
import numpy as np
import datetime
customers = {
'CustomerID':[10,11],
'Name':['xiaomin','zhansan'],
'Address':['csuft','changsha']
}
customers = pd.DataFrame(customers)
customers
orders = {
'CustomerID':[10,11,10],
'OrderDate':[
datetime.date(2016,12,1),
datetime.date(2016,12,1),
datetime.date(2016,12,2)
]
}
orders = pd.DataFrame(orders)
orders
通过merge进行连接:
customers.merge(orders)
默认情况下使用inner连接。其他方法类似,在这里不在讲解。