分组和聚合DataFrame信息的案例解析如下:
首先,我们需要导入pandas库,并创建一个字典,其中键是列名,值是列中的数据。然后,我们可以使用pandas的DataFrame()函数将字典转换为DataFrame。
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六'],
'年龄': [25, 30, 35, 40],
'城市': ['北京', '上海', '深圳', '广州']
}
df = pd.DataFrame(data)
print(df)
输出结果:
姓名 年龄 城市
0 张三 25 北京
1 李四 30 上海
2 王五 35 深圳
3 赵六 40 广州
接下来,我们可以使用DataFrame的groupby()方法对数据进行分组。例如,我们可以根据城市对数据进行分组。
grouped_data = df.groupby('城市')
print(grouped_data)
输出结果:
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x7f8c1c1d3a90>
现在,我们可以使用聚合函数对分组后的数据进行聚合操作。例如,我们可以计算每个城市的平均年龄。
average_age = grouped_data['年龄'].mean()
print(average_age)
输出结果:
城市
北京 25.0
上海 30.0
深圳 35.0
广州 40.0
Name: 年龄, dtype: float64
我们还可以使用其他聚合函数,如sum、count等,对分组后的数据进行聚合操作。