数据
实战
1、读取表格数据
import pandas
data = pandas.ExcelFile('数字经济.xlsx')
sheet_names = data.sheet_names
print(sheet_names)
2、读取某个单元格中数据
for sheet in sheet_names:
if sheet == '2020年指标':
# 读取2020年指标
df = pandas.read_excel('数字经济.xlsx', sheet_name=sheet)
print(df)
3、剔除不需要的数据
df = df.iloc[1:, :]
# 修改表前2行的数据并将表头修改
df.columns = df.iloc[0:2, :].values[0]
# 提取数据
print(df)
4、选中某列数据进行提取
sl_df = df["移动电话基站(万个)"]
# 提取值
salary = df.values
print(salary)
5、继续处理数据,以满足数据分析的需求
# 0 是城市
city = [city[0] for city in salary]
print(city)
# 1 是移动电话基站(万个)
iphone_01 = [city[1] for city in salary]
# 2 移动电话普及率(部/百人)
iphone_02 = [city[2] for city in salary]
print(iphone_02)
6、数据分析可视化
import matplotlib.pyplot as plt
import matplotlib
size = list()
for font_size in iphone_02:
size.append(font_size) if font_size > 100 else size.append(100)
# 设置字体
font = {'family': 'simHei',
'weight': 'bold',
'size': '12'}
matplotlib.rc('font', **font)
plt.figure(figsize=(10, 10), dpi=80)
plt.scatter(iphone_01, iphone_02, s=size,c='red')
plt.xlabel("移动电话基站(万个)", fontdict={'size': 16})
plt.ylabel("移动电话普及率(部/百人)", fontdict={'size': 16})
plt.title("2020年指标", fontdict={'size': 20})
plt.savefig('手机基站数据分析.png',dpi=80)
plt.show()
散点图
折线图
如果学习上有遇到问题,加/:yiyi990805(备注:阿里云tony)即可。