小白数据分析系列,开写!!!

简介: 小白数据分析系列,开写!!!

前言

Hello,各位小伙伴,今天开始我们来学习数据分析、处理相关的知识。有一部分读者知道我主要学习的语言是Java,但是Python也是我最感兴趣的语言之一,Python在平时当中更多的是给我一种辅助。所以这个系列的知识,我打算用最简单、轻松的方式来讲解相关的知识。

在前面我写过很多的爬虫类的文章,我自己也帮别人做过几个爬虫类的项目,所以数据的重要性以及价值是非常高的。很多时候,你获取了数据,但是你并不知道如何利用起来,这就说明了我们数据分析的能力还需要提升。我并不觉得数据分析是一门课,我更偏向于是我们的一种能力,我们只不过通过编程来实现它。


学习数据分析有什么用?

不管学什么之前,我都会问自己学这个东西有什么用,其次才是如何去学。

数据,我相信每个人都对它并不陌生。数据分析就是通过大量数据进行分析,得出某种规律,以帮助我们来作出一系列的判断,从而采取一些相应的措施。


1.jpg


上面可能会有些拗口,举个简单的例子,如果我们想去淘宝上开个商铺,到底卖什么好呢?如果我们此时有淘宝每类商品的售卖情况数据,通过简单的分析,我们就可以列出排名前几的商品了,然后卖啥,你懂的~


matplotlib

matplotlib这个库相信大家听说过,这个库能够帮我们通过图形的形式来可视化数据。有些人会说,数据分析不应该先学分析吗?为什么先学可视化呢?

这其实是我自己的习惯,如果一上来就去学一些枯燥的分析方法,那必定会放弃,如果开始就来学习一些可视化的东西,会让我的兴趣更大(兴趣是最好的老师)。

废话不多说(上面也不完全是废话,不管学什么都需要的必备步骤),我们直接开干!

matplotlib: 目前比较流行的Python底层绘图库,主要做数据可视化图表,从名字上看与我们的MATLAB很像,其实它就是模仿MATLAB构建的。


matplotlib基础绘图

我们首先来画个简单的图形


# 导入相关库
import matplotlib.pyplot as plt
# 设置x轴上的值
x = [1, 2, 3]
# 设置y轴上的值
y = [1, 2, 3]
# 画出折线图
plt.plot(x, y)
# 展示折线图
plt.show()


效果:


2.png


在上面的代码中可以看到我们创建了两个列表x,y ,其实这两个列表一一对应就是一个一个的坐标,例如上面的坐标就是 (1,1) (2,2) (3,3)

我们可以简单的进行修改


# 设置x轴上的值
x = [4, 1, 5]
# 设置y轴上的值
y = [2, 3, 4]


效果:


3.jpg


对应的坐标就是(4,2) (1,3) (5,4)


设置图片大小以及保存图片

有时我们需要将图片的大小设置成我们需要的大小,并且更多时候想把我们可视化的图片给下载下来,怎么操作呢?

只需通过下面一行代码即可:


# figsize设置图片大小(20为长,8位宽),dpi像素点
fig = plt.figure(figsize=(20, 8), dpi=80)


4.jpg


未修改之前


5.jpg


修改之后

可以看到我们的图片大小产生了变化。

除此之外,我们也需要知道保存自己分析后的图片方法。同样,只需一行代码就能够简单实现:


# 保存图片,可以保存为svg矢量图格式
plt.savefig("t1.png")


6.jpg


生成后的图片

这里的svg矢量图就是比较适合网页上面的图片,具体的大家可以百度一下。


改变横纵坐标的刻度

很多时候我们都需要来修改我们的坐标轴刻度以满足我们的数据分析要求,如何修改,其实也非常的简单。


# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为1
x_list = range(0, 10, 1)
_x = x_list
plt.xticks(_x)
y_list = range(0, 10, 1)
_y = y_list
plt.yticks(_y)


效果:


7.jpg


我们将其简单的修改一下


# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为2
x_list = range(0, 10, 2)
_x = x_list
plt.xticks(_x)
y_list = range(0, 10, 2)
_y = y_list
plt.yticks(_y)


效果:


8.jpg


到目前,基本的折线图我们能够完成了,为了保证每篇文章的篇幅以及大家的阅读体验,这里就不多写了,下一篇文章我们将继续来研究matplotlib。


总结

这篇文章主要是用来开篇,看看大家的反响如何,如果你正在学习这方面的知识,或者你在工作中需要这方面的知识,希望能够继续阅读数据分析这个系列的文章,麻烦各位老铁点点右下角的在看

相关文章
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能的边界拓展:从理论到实践的飞跃####
本文探讨了人工智能(AI)技术的最新进展,特别是深度学习领域的创新如何推动AI从理论研究走向广泛应用。通过分析几个关键领域的实际应用案例,如医疗健康、自动驾驶和自然语言处理,本文揭示了AI技术的潜力及其对社会和经济的深远影响。文章还讨论了当前面临的挑战,包括伦理问题和技术瓶颈,并展望了未来的发展趋势。 ####
|
8月前
|
算法 数据安全/隐私保护
基于DVB-T的COFDM+16QAM+LDPC图传通信系统matlab仿真,包括载波同步,定时同步,信道估计
### 简介 本项目基于DVB-T标准,实现COFDM+16QAM+LDPC码通信链路的MATLAB仿真。通过COFDM技术将数据分成多个子载波并行传输,结合16QAM调制和LDPC编码提高传输效率和可靠性。系统包括载波同步、定时同步和信道估计模块,确保信号的准确接收与解调。MATLAB 2022a仿真结果显示了良好的性能,完整代码无水印。仿真操作步骤配有视频教程,便于用户理解和使用。 核心程序涵盖导频插入、载波频率同步、信道估计及LDPC解码等关键环节。仿真结果展示了系统的误码率性能,并保存为R1.mat文件。
236 76
|
7月前
|
弹性计算 人工智能 资源调度
DeepSeek大解读系列公开课上新!阿里云专家主讲云上智能算力、Kubernetes容器服务、DeepSeek私有化部署
智猩猩「DeepSeek大解读」系列公开课第三期即将开讲,聚焦阿里云弹性计算助力大模型训练与部署。三位专家将分别讲解智能算力支撑、Kubernetes容器服务在AI场景的应用实践、以及DeepSeek一键部署和多渠道应用集成,分享云计算如何赋能大模型发展。欲观看直播,可关注【智猩猩GenAI视频号】预约。 (239字符)
|
10月前
|
移动开发 前端开发 JavaScript
React 表单验证实战
【10月更文挑战第25天】本文介绍了 React 表单验证的常见方法,包括原生 HTML5 验证、自定义验证逻辑和第三方库(如 Formik 和 Yup)的使用。通过具体代码示例,详细讲解了每种方法的实现步骤,并探讨了常见问题和易错点及其解决方法。旨在帮助开发者提高表单验证的有效性和安全性。
231 9
|
存储 弹性计算 安全
构建高效企业应用架构:阿里云产品组合实践深度解析
该方案展现了阿里云产品组合的强大能力和灵活性,不仅满足了当前业务需求,也为未来的扩展打下了坚实的基础。希望本文的分享能为读者在设计自己的IT解决方案时提供一定的参考和启发。
568 1
|
存储 Java 区块链
fabric智能合约
fabric智能合约
507 0
|
安全 API 调度
HarmonyOS学习路之开发篇—流转
随着全场景多设备生活方式的不断深入,用户拥有的设备越来越多,每个设备都能在适合的场景下提供良好的体验,例如:手表可以提供及时的信息查看能力,电视可以带来沉浸的观影体验。但是,每个设备也有使用场景的局限,例如:在电视上输入文本相对手机来说是非常糟糕的体验。当多个设备通过分布式操作系统能够相互感知、进而整合成一个超级终端时,设备与设备之间就可以取长补短、相互帮助,为用户提供更加自然流畅的分布式体验。
|
存储 安全 Docker
直接停掉docker后镜像都没了
7月更文挑战第12天
1642 7
|
JavaScript Linux 编译器
c++开源协程库libgo介绍及使用
c++开源协程库libgo介绍及使用
【stream】List根据某个字段求和
【stream】List根据某个字段求和
765 0

热门文章

最新文章