基于python的pyecharts大数据作图方法与简单修饰

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 引入在前期学习了一些数据处理操作之后,我们想要将其进行可视化处理,生成能直观感受的数据分析结果,以此来讲解给需要用到结果的人——或者让自己看得舒服——我们用pandas自带的作图工具有的时候不那么如人意,其可定制化程度不高,难以满足一些需求这个时候我们就需要用新的工具了——他就是pyecharts

引入


在前期学习了一些数据处理操作之后,我们想要将其进行可视化处理,生成能直观感受的数据分析结果,以此来讲解给需要用到结果的人——或者让自己看得舒服——

我们用pandas自带的作图工具有的时候不那么如人意,其可定制化程度不高,难以满足一些需求

这个时候我们就需要用新的工具了——

他就是pyecharts


一、什么是pyecharts


首先我们要知道一个东西——Echarts:

Echarts是一个由百度开源的商业级数据图表,它是一个纯JavaScript的图表库,在业界非常有名。

因为他可以为用户提供直观生动,可交互,可高度个性化定制的数据可视化图表,赋予了用户对数据进行挖掘整合的能力。

而pyecharts顾名思义,就是python和echarts连接起来,从而用python做出echarts图表的第三方库了


二、模块安装与导入


首先我们需要打开随便一个py运行环境(这里我们以jupyter notebook为例)

输入pip install pyecharts来安装该依赖


image.pngimage.png

image.png


获得如图的提示即为安装成功(其实没有报错就是安装成功)

加载必要依赖。


import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#如果是pyecharts更早的版本可能不需要运行下面的命令
import pyecharts
pyecharts.globals._WarningControl.ShowWarning = False
import warnings
warnings.filterwarnings('ignore')#隐藏警告


image.png

隐藏警告是为了防止版本更新带来的一些的提示。基本操作学习中不需要考虑太多,否则容易进度太慢而造成拖延和不自信。


三、作图的通用流程


1. 选择图的类型

1. 导入图所需要的数据

如上,两步几乎涵盖了作图的所有进程。

以创建一个柱状图bar为例:

我们先要有一个数据(前期准备)

x=list(range(1,8))
#x=[2,1,4,5,7,8,10]
y=[114, 55, 27, 101, 125, 27, 105]

这样我们可以得到一个1~7的x值,以及可以与x一一对应的y值。正好适合作柱状图的数据

from pyecharts import options as opts
from pyecharts.charts import Bar

从pyecharts中引入我们需要的工具。然后就可以开始作图了!

bar = Bar()
bar.add_xaxis(list(x))
bar.add_yaxis("name", y)
bar.render_notebook()#用来在notebook中展示图形,使用render则会直接保存为html文件

第一行创建一个bar对象(选择图的类型),二三行是为了把数据导入(导入图所需要的数据)。

这样其实一个图就创建好了。我们为了更好地调试,用第四行代码把图在notebook中展示出来——

image.png

如图,创建过程非常丝滑。有空一定要亲自体验一下。echarts具有交互属性,你可以用鼠标移动到各个柱子上,他会显示出图所代表的名字以及xy值。非常好用


四、简单修饰


用pyecharts非常重要的原因之一是其可定制化和交互性。如何利用好这些优点,需要我们善于用代码修饰我们作出的图表。

使其符合我们的需要才是关键

下面来看看如何客制化一个柱状图bar:

Tip:做数据分析练习的时候有个十分头疼的问题是我们没有足够时候的数据。pyecharts库提供了一个非常人性化的小工具——faker,可以生成我们图表需要的数据,这样我们可以快速将重点精力集中在图表制作和测试:


from pyecharts.faker import Faker#用来产生伪数据的包
复制代码


接下来我们把相关变量直接放进我们的图标生成代码里,方便大家切身体会一下这些可以自定义的变量的位置和使用逻辑,毕竟实操才是最有效的学习码代码的方法。


c = (
    Bar(init_opts=opts.InitOpts(width="620px", height="300px"))
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values())
    .add_yaxis("商家B", Faker.values())
    .set_global_opts(title_opts=opts.TitleOpts(title="Bar-基本示例", subtitle="我是副标题"))
)
复制代码


这是一个python语句的写法。其实分开来一行一行写就像(三)中那样也是可以的。这里就理解成是从上到下依次对c执行这些操作。

Bar()生成bar图表(选择图表类型),add_xaxis()和add_yaxis()分别为x和y坐标创建名称和数据。global_opt中的title——opt参数中可以设置主标题副标题。

其中y的括号中第一个参数是图例名,即一个统计量。右边的是数据,我们用Faker的自动生成数据代替。 x则直接用Faker自动生成的商品名代替。

多说无益,直接看效果:c.render_notebook查看图表:


image.pngimage.png

image.png

生成过程非常丝滑,图表也非常好看。

快来开发出赏心悦目的数据图表吧~

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
65 3
|
15天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
51 2
|
25天前
|
安全
Python-打印99乘法表的两种方法
本文详细介绍了两种实现99乘法表的方法:使用`while`循环和`for`循环。每种方法都包括了步骤解析、代码演示及优缺点分析。文章旨在帮助编程初学者理解和掌握循环结构的应用,内容通俗易懂,适合编程新手阅读。博主表示欢迎读者反馈,共同进步。
|
1月前
|
JSON 安全 API
Python调用API接口的方法
Python调用API接口的方法
178 5
|
2月前
|
算法 决策智能 Python
Python中解决TSP的方法
旅行商问题(TSP)是寻找最短路径,使旅行商能访问每个城市一次并返回起点的经典优化问题。本文介绍使用Python的`ortools`库解决TSP的方法,通过定义城市间的距离矩阵,调用库函数计算最优路径,并打印结果。此方法适用于小规模问题,对于大规模或特定需求,需深入了解算法原理及定制策略。
45 15
WK
|
2月前
|
Python
Python中format_map()方法
在Python中,`format_map()`方法用于使用字典格式化字符串。它接受一个字典作为参数,用字典中的键值对替换字符串中的占位符。此方法适用于从字典动态获取值的场景,尤其在处理大量替换值时更为清晰和方便。
WK
103 36
|
2月前
|
机器学习/深度学习 人工智能 算法
强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用
本文探讨了强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用,通过案例分析展示了其潜力,并讨论了面临的挑战及未来发展趋势。强化学习正为游戏AI带来新的可能性。
120 4
|
2月前
|
存储 机器学习/深度学习 大数据
量子计算与大数据:处理海量信息的新方法
量子计算作为革命性的计算范式,凭借量子比特和量子门的独特优势,展现出在大数据处理中的巨大潜力。本文探讨了量子计算的基本原理、在大数据处理中的应用及面临的挑战与前景,展望了其在金融、医疗和物流等领域的广泛应用。
|
2月前
|
Python
Python编程中的魔法方法(Magic Methods)
【10月更文挑战第40天】在Python的世界中,魔法方法就像是隐藏在代码背后的神秘力量。它们通常以双下划线开头和结尾,比如 `__init__` 或 `__str__`。这些方法定义了对象的行为,当特定操作发生时自动调用。本文将揭开这些魔法方法的面纱,通过实际例子展示如何利用它们来增强你的类功能。
25 1
|
2月前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集