通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的变化。
本次使用年份进行分组,一下是数据格式
1. data=pd.DataFrame(data_err.release_date) 2. data
使用pandas函数进行cut
1. from pandas import Series,DataFrame 2. import pandas as pd 3. import numpy as np 4. from numpy import nan as NA 5. from matplotlib import pyplot as plt 6. ages = data.release_date 7. #将所有的ages进行分组 8. bins = [1916, 1926, 1936, 1946, 1956, 1966, 1976, 1986, 1996, 2006, 2016] 9. #使用pandas中的cut对年龄数据进行分组 10. cats = pd.cut(ages,bins) 11. cats
将所有的ages进行分组 使用pandas中的cut对年龄数据进行分组
1. # #调用pd.value_counts方法统计每个区间的人数 2. pd.value_counts(cats)
# #为分类出来的每一组年龄加上标签
1. group_names = ["1916年-1926年", "1926年-1936年", "1936年-1946年", "1946年-1956年", "1956年-1966年", "1966年-1976年", "1976年-1986年", "1986年-1996年", "1996年-2006年", "2006年-2016年"] 2. personType = pd.cut(ages,bins,labels=group_names) 3. personType
1. pd.cut(ages,bins=bins,right=False,labels=group_names).value_counts().plot(kind='bar') 2. plt.xticks(rotation=20) 3. plt.title("电影各年份区间发行量统计条形图") 4. plt.xlabel("年份区间") 5. plt.ylabel("发行量") 6. # 数据对应每个点
通过图表的信息我们可以清晰的了解到,随着年份的推移电影的发行量也在逐年的递增,并且递增的速度是非常快的,可见电影的发展是非常快的,并会呈现上升的趋势。随着经济的发展也出现空前的繁荣现象