pandas使用cut进行分割每组数据

简介: pandas使用cut进行分割每组数据

通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的变化。

本次使用年份进行分组,一下是数据格式

1. data=pd.DataFrame(data_err.release_date)
2. data

使用pandas函数进行cut

1. from pandas import Series,DataFrame
2. import pandas as pd
3. import numpy as np
4. from numpy import nan as NA 
5. from matplotlib import pyplot as plt
6. ages = data.release_date
7. #将所有的ages进行分组
8. bins = [1916, 1926, 1936, 1946, 1956, 1966, 1976, 1986, 1996, 2006, 2016]
9. #使用pandas中的cut对年龄数据进行分组
10. cats = pd.cut(ages,bins)
11. cats

将所有的ages进行分组 使用pandas中的cut对年龄数据进行分组

 

1. # #调用pd.value_counts方法统计每个区间的人数
2. pd.value_counts(cats)

# #为分类出来的每一组年龄加上标签

1. group_names = ["1916年-1926年", "1926年-1936年", "1936年-1946年", "1946年-1956年", "1956年-1966年", "1966年-1976年", "1976年-1986年", "1986年-1996年", "1996年-2006年", "2006年-2016年"]
2. personType = pd.cut(ages,bins,labels=group_names)
3. personType
1. pd.cut(ages,bins=bins,right=False,labels=group_names).value_counts().plot(kind='bar')
2. plt.xticks(rotation=20)
3. plt.title("电影各年份区间发行量统计条形图")
4. plt.xlabel("年份区间") 
5. plt.ylabel("发行量") 
6. # 数据对应每个点

数据可视化

通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的递增,并且递增的速度是非常快的,可见电影的发展是非常快的,并会呈现上升的趋势。随着经济的发展也出现空前的繁荣现象


相关文章
|
14天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
24 2
|
14天前
|
存储 Python
使用Pandas库对非数值型数据进行排序和排名
在Pandas中,支持对非数值型数据排序和排名。可按以下方法操作:1) 字符串排序,使用`sort_values()`,如`sorted_df = df.sort_values(by='Name', ascending=False)`进行降序排序;2) 日期排序,先用`to_datetime()`转换,再排序,如`sorted_df = df.sort_values(by='Date')`;3) 自定义排序,结合`argsort()`和自定义规则。
25 2
|
2月前
|
数据格式 Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数转换数据格式。示例代码展示了如何通过`melt()`转为长格式,再用`pivot()`恢复为宽格式。输入数据是包含'Name'和'Age'列的DataFrame,最终结果经过转换后呈现出不同的布局。
41 6
|
2月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名?
Pandas在Python中提供数据排序和排名功能。使用`sort_values()`进行排序,如`df.sort_values(by='A', ascending=False)`进行降序排序;用`rank()`进行排名,如`df['A'].rank(ascending=False)`进行降序排名。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`。
29 6
|
2月前
|
索引 Python
如何使用Python的Pandas库进行数据合并和拼接?
【2月更文挑战第28天】【2月更文挑战第103篇】如何使用Python的Pandas库进行数据合并和拼接?
|
2月前
|
索引 Python
如何在Python中,Pandas库实现对数据的时间序列分析?
Pandas在Python中提供强大的时间序列分析功能,包括:1) 使用`pd.date_range()`创建时间序列;2) 通过`pd.DataFrame()`将时间序列转为DataFrame;3) `set_index()`设定时间列作为索引;4) `resample()`实现数据重采样(如按月、季度);5) `rolling()`进行移动窗口计算,如计算移动平均;6) 使用`seasonal_decompose()`进行季节性调整。这些工具适用于各种时间序列分析场景。
41 0
|
10天前
|
数据采集 数据处理 索引
如何使用 Pandas 删除 DataFrame 中的非数字类型数据?
如何使用 Pandas 删除 DataFrame 中的非数字类型数据?
24 3
|
11天前
|
存储 数据挖掘 数据处理
使用pandas高效读取筛选csv数据
本文介绍了使用Python的Pandas库读取和处理CSV文件。首先,确保安装了Pandas,然后通过`pd.read_csv()`函数读取CSV,可自定义分隔符、列名、索引等。使用`head()`查看数据前几行,`info()`获取基本信息。Pandas为数据分析提供强大支持,是数据科学家的常用工具。
18 0
|
13天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
18 0
|
13天前
|
索引 Python
如何使用Pandas进行数据合并?
Pandas提供`merge()`, `join()`, `concat()`等方法进行数据合并。基本步骤包括导入pandas库、创建或加载DataFrame,然后调用这些方法合并数据。示例中展示了如何使用`merge()`和`join()`:创建两个DataFrame `df1`和`df2`,通过`merge()`基于索引合并,以及`join()`进行外连接合并。
18 0