小白数据分析系列,开写!!!

简介: 小白数据分析系列,开写!!!

前言

Hello,各位小伙伴,今天开始我们来学习数据分析、处理相关的知识。有一部分读者知道我主要学习的语言是Java,但是Python也是我最感兴趣的语言之一,Python在平时当中更多的是给我一种辅助。所以这个系列的知识,我打算用最简单、轻松的方式来讲解相关的知识。

在前面我写过很多的爬虫类的文章,我自己也帮别人做过几个爬虫类的项目,所以数据的重要性以及价值是非常高的。很多时候,你获取了数据,但是你并不知道如何利用起来,这就说明了我们数据分析的能力还需要提升。我并不觉得数据分析是一门课,我更偏向于是我们的一种能力,我们只不过通过编程来实现它。


学习数据分析有什么用?

不管学什么之前,我都会问自己学这个东西有什么用,其次才是如何去学。

数据,我相信每个人都对它并不陌生。数据分析就是通过大量数据进行分析,得出某种规律,以帮助我们来作出一系列的判断,从而采取一些相应的措施。


1.jpg


上面可能会有些拗口,举个简单的例子,如果我们想去淘宝上开个商铺,到底卖什么好呢?如果我们此时有淘宝每类商品的售卖情况数据,通过简单的分析,我们就可以列出排名前几的商品了,然后卖啥,你懂的~


matplotlib

matplotlib这个库相信大家听说过,这个库能够帮我们通过图形的形式来可视化数据。有些人会说,数据分析不应该先学分析吗?为什么先学可视化呢?

这其实是我自己的习惯,如果一上来就去学一些枯燥的分析方法,那必定会放弃,如果开始就来学习一些可视化的东西,会让我的兴趣更大(兴趣是最好的老师)。

废话不多说(上面也不完全是废话,不管学什么都需要的必备步骤),我们直接开干!

matplotlib: 目前比较流行的Python底层绘图库,主要做数据可视化图表,从名字上看与我们的MATLAB很像,其实它就是模仿MATLAB构建的。


matplotlib基础绘图

我们首先来画个简单的图形


# 导入相关库
import matplotlib.pyplot as plt
# 设置x轴上的值
x = [1, 2, 3]
# 设置y轴上的值
y = [1, 2, 3]
# 画出折线图
plt.plot(x, y)
# 展示折线图
plt.show()


效果:


2.png


在上面的代码中可以看到我们创建了两个列表x,y ,其实这两个列表一一对应就是一个一个的坐标,例如上面的坐标就是 (1,1) (2,2) (3,3)

我们可以简单的进行修改


# 设置x轴上的值
x = [4, 1, 5]
# 设置y轴上的值
y = [2, 3, 4]


效果:


3.jpg


对应的坐标就是(4,2) (1,3) (5,4)


设置图片大小以及保存图片

有时我们需要将图片的大小设置成我们需要的大小,并且更多时候想把我们可视化的图片给下载下来,怎么操作呢?

只需通过下面一行代码即可:


# figsize设置图片大小(20为长,8位宽),dpi像素点
fig = plt.figure(figsize=(20, 8), dpi=80)


4.jpg


未修改之前


5.jpg


修改之后

可以看到我们的图片大小产生了变化。

除此之外,我们也需要知道保存自己分析后的图片方法。同样,只需一行代码就能够简单实现:


# 保存图片,可以保存为svg矢量图格式
plt.savefig("t1.png")


6.jpg


生成后的图片

这里的svg矢量图就是比较适合网页上面的图片,具体的大家可以百度一下。


改变横纵坐标的刻度

很多时候我们都需要来修改我们的坐标轴刻度以满足我们的数据分析要求,如何修改,其实也非常的简单。


# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为1
x_list = range(0, 10, 1)
_x = x_list
plt.xticks(_x)
y_list = range(0, 10, 1)
_y = y_list
plt.yticks(_y)


效果:


7.jpg


我们将其简单的修改一下


# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为2
x_list = range(0, 10, 2)
_x = x_list
plt.xticks(_x)
y_list = range(0, 10, 2)
_y = y_list
plt.yticks(_y)


效果:


8.jpg


到目前,基本的折线图我们能够完成了,为了保证每篇文章的篇幅以及大家的阅读体验,这里就不多写了,下一篇文章我们将继续来研究matplotlib。


总结

这篇文章主要是用来开篇,看看大家的反响如何,如果你正在学习这方面的知识,或者你在工作中需要这方面的知识,希望能够继续阅读数据分析这个系列的文章,麻烦各位老铁点点右下角的在看

相关文章
|
8月前
|
机器学习/深度学习 算法 数据挖掘
数据分析入门系列教程-股票走势预测分析
数据分析入门系列教程-股票走势预测分析
120 0
数据分析入门系列教程-股票走势预测分析
|
机器学习/深度学习 SQL 数据采集
【数据分析】————面试总结
【数据分析】————面试总结
1038 0
|
SQL 数据可视化 数据挖掘
数据分析 常见技巧和经验总结
Pandas中有很多数据类型,其中有一种是datetime,即日期时间,如Timestamp(‘2020-09-22 20:43:00’),表示其是一个时间戳类型,很多时候需要将其转化为字符串,以便获取到其中的日期或时间,此时可以对其调用strftime()方法,如strftime('%Y-%m-%d')就可以获取到字符串2020-09-22。
数据分析 常见技巧和经验总结
|
数据挖掘 数据处理
动手学习数据分析(二)——数据处理
该数据集缺失的都是类别特征里的,且部分类别特征与某些匿名变量线性相关性强 考虑填充新的值,比如-1 填充众数、平均数(需要取整),knn邻近(速度慢)
106 0
动手学习数据分析(二)——数据处理
|
数据可视化 数据挖掘
动手学习数据分析(四)——数据可视化
动手学习数据分析(四)——数据可视化
134 0
动手学习数据分析(四)——数据可视化
|
机器学习/深度学习 分布式计算 安全
python数据分析-开篇什么是数据分析
在《增长黑客》提到的增长团队中重要成员是数据分析师;数据分析师从数据角度抽丝剥茧,不断验证,A/B测试,找到问题,提出增长建议。数据分析师就像侦探一样,找线索,求真相, 是艰难但富有挑战的工作。
125 0
python数据分析-开篇什么是数据分析
|
数据挖掘
这个“数据分析思维导图”,小白看了都知道从何下手!
这个“数据分析思维导图”,小白看了都知道从何下手!
这个“数据分析思维导图”,小白看了都知道从何下手!
|
数据采集 SQL 分布式计算
听说数据分析师挺火,我们来数据分析一下
经常看见各种数据分析师培训的运营推荐,那么数据分析师的就业行情究竟如何?让我们用数据说话,一探究竟!
189 0
听说数据分析师挺火,我们来数据分析一下
|
自然语言处理 算法 数据挖掘
实战案例解读:数据分析,如何更进一步?
本文从一个具体的评价分析场景切入,按步分析,力求还原分析的每个环节。
246 0
实战案例解读:数据分析,如何更进一步?
|
机器学习/深度学习 SQL 人工智能
如何入门数据分析?
如何入门数据分析?
176 0