pandas使用cut进行分割每组数据

简介: pandas使用cut进行分割每组数据

通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的变化。

本次使用年份进行分组,一下是数据格式

1. data=pd.DataFrame(data_err.release_date)
2. data

使用pandas函数进行cut

1. from pandas import Series,DataFrame
2. import pandas as pd
3. import numpy as np
4. from numpy import nan as NA 
5. from matplotlib import pyplot as plt
6. ages = data.release_date
7. #将所有的ages进行分组
8. bins = [1916, 1926, 1936, 1946, 1956, 1966, 1976, 1986, 1996, 2006, 2016]
9. #使用pandas中的cut对年龄数据进行分组
10. cats = pd.cut(ages,bins)
11. cats

将所有的ages进行分组 使用pandas中的cut对年龄数据进行分组

 

1. # #调用pd.value_counts方法统计每个区间的人数
2. pd.value_counts(cats)

# #为分类出来的每一组年龄加上标签

1. group_names = ["1916年-1926年", "1926年-1936年", "1936年-1946年", "1946年-1956年", "1956年-1966年", "1966年-1976年", "1976年-1986年", "1986年-1996年", "1996年-2006年", "2006年-2016年"]
2. personType = pd.cut(ages,bins,labels=group_names)
3. personType
1. pd.cut(ages,bins=bins,right=False,labels=group_names).value_counts().plot(kind='bar')
2. plt.xticks(rotation=20)
3. plt.title("电影各年份区间发行量统计条形图")
4. plt.xlabel("年份区间") 
5. plt.ylabel("发行量") 
6. # 数据对应每个点

数据可视化

通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的递增,并且递增的速度是非常快的,可见电影的发展是非常快的,并会呈现上升的趋势。随着经济的发展也出现空前的繁荣现象


相关文章
|
3月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
61 2
|
3月前
|
存储 Python
使用Pandas库对非数值型数据进行排序和排名
在Pandas中,支持对非数值型数据排序和排名。可按以下方法操作:1) 字符串排序,使用`sort_values()`,如`sorted_df = df.sort_values(by='Name', ascending=False)`进行降序排序;2) 日期排序,先用`to_datetime()`转换,再排序,如`sorted_df = df.sort_values(by='Date')`;3) 自定义排序,结合`argsort()`和自定义规则。
51 2
|
3月前
|
Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数变换数据。示例代码:导入pandas,定义一个包含'Name'和'Age'列的DataFrame,使用`melt()`转为长格式,再用`pivot()`恢复为宽格式。
93 1
|
3月前
|
索引 Python
如何使用Python的Pandas库进行数据合并和拼接?
Pandas的`merge()`函数用于数据合并,如示例所示,根据'key'列对两个DataFrame执行内连接。`concat()`函数用于数据拼接,沿轴0(行)拼接两个DataFrame,并忽略原索引。
74 2
|
1月前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
50 1
|
3月前
|
存储 JSON 数据处理
从JSON数据到Pandas DataFrame:如何解析出所需字段
从JSON数据到Pandas DataFrame:如何解析出所需字段
203 1
|
19天前
|
存储 数据可视化 Python
Python中的数据可视化:使用Matplotlib和Pandas探索数据
【7月更文挑战第31天】 在数据科学的世界里,可视化是理解复杂数据集的关键。本文将引导你通过Python的Matplotlib库和Pandas库来揭示数据背后的故事。我们将一起构建图表,从简单的线图到复杂的热图,每一步都将用代码示例来丰富你的理解。文章不仅仅是展示如何绘制图表,更是一次深入探索数据结构和模式的旅程。
40 8
|
4天前
|
Python
Pandas 读取Eexcel - 间隔N行,读取某列数据
Pandas 读取Eexcel - 间隔N行,读取某列数据
9 0
|
17天前
|
Python
【Pandas】Pandas的DataFrame按行插入list数据或者读取一行并存为csv文件
本文提供了使用Pandas库对DataFrame进行操作的示例代码。
19 0