Python数据分析系列01-数据可视化展示

简介: 人生总是在不断的经历机遇与挑战,尽管现在的人很多都会选择躺平,但不得不承认的是,即便是一个躺平的人,同样会遇到一些生活中的挑战,而当你没有办法回避的时候,也就只能迎难而上了。我们不该因为困难就轻易放弃,因为一切都会更加的值得。

实战

数据分析说白了就是对数据进行筛选、处理的一个过程,之后将清洗的数据进行图形可视化进行展示;比如这样的;先上一张完整版的图。
image.png

素材准备:
1、excel表格文件一份
2、安装第三方库 pip install pandas
3、安装第三方库 pip install matplotlib
表格素材

image.png

第一步: 读取excel 数据

import pandas

read_xl = pandas.read_excel('lagouzp.xls')

print(read_xl)

可以顺利的看到表格中有198 行 x 11列 的数据,展示了出来。接下来进行数据的提取,选择要处理并用于展示图像的某列,进行提取。
这里采用城市+薪资。
image.png

image.png

第二步: 对数据 excel 进行处理

数据分析需要的数据种类是int类型,我们这里提取到的薪资数据明显是不符合要求的。让我们来处理一番。

# 1、需要被替换的值  2、 替换成什么样子
read_xl['薪资'] = read_xl['薪资'].str.replace('k','')
# 1530  薪资的区间  -  分割 - [15, 30]
read_xl['薪资'] = read_xl['薪资'].str.split('-')
#  最高薪资
read_xl['薪资'] = read_xl['薪资'].str[1]
print(read_xl['薪资'])
# 转换类型
read_xl['薪资'] = read_xl['薪资'].astype('int')

print(read_xl.dtypes)

经过我们的处理,数据已经符合我们的要求,接下来需要在对城市进行分组处理。
image.png

image.png

#  平均值 -  聚合  分组
city = read_xl.groupby(by='城市').mean()

name = city['薪资']

print(name)

image.png

第三步:筛选、清洗处理后的数据 - 数据分析- 绘制图像

from matplotlib import pyplot as plt

# 柱状图
plt.bar(x,y)

# 显示图像
plt.show()

结果展示

image.png

image.png

image.png

image.png

image.png

image.png

在这个浮躁的时代;竟然还有人能坚持篇篇原创;
如果本文对你学习有所帮助-可以点赞👍+ 关注!将持续更新更多新的文章。
支持原创。感谢!
相关文章
|
13天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
39 0
|
8天前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
44 19
|
3天前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
7天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
19 2
|
7天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
16 1
|
8天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
8天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
14天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
28 2
|
19天前
|
数据可视化 数据挖掘 Python
使用Python进行数据可视化:探索与实践
【10月更文挑战第21天】本文旨在通过Python编程,介绍如何利用数据可视化技术来揭示数据背后的信息和趋势。我们将从基础的图表创建开始,逐步深入到高级可视化技巧,包括交互式图表和动态展示。文章将引导读者理解不同图表类型适用的场景,并教授如何使用流行的库如Matplotlib和Seaborn来制作美观且具有洞察力的可视化作品。
44 7
|
18天前
|
数据可视化 定位技术 Python
使用Python进行数据可视化
【10月更文挑战第22天】在这篇文章中,我们将深入探讨如何使用Python进行数据可视化。我们将从基础的图表开始,然后逐步进入更复杂的可视化技术。我们将通过实例代码来展示如何实现这些可视化,以便读者能够更好地理解和应用这些技术。
20 5