Python 金融编程第二版(三)(3)

简介: Python 金融编程第二版(三)

Python 金融编程第二版(三)(2)https://developer.aliyun.com/article/1559412


第七章:数据可视化

使用图片。一图胜千言。

阿瑟·布里斯班(1911 年)

本章介绍了matplotlibplotly库的基本可视化能力。

尽管有许多其他可用的可视化库,但matplotlib已经确立了自己作为基准,并且在许多情况下是一个强大而可靠的可视化工具。在标准绘图方面易于使用,在更复杂的绘图和定制方面灵活。此外,它与NumPypandas及它们提供的数据结构紧密集成。

matplotlib仅允许以位图形式(例如 PNG 或 JPG 格式)生成图。另一方面,现代网络技术允许基于数据驱动文档(D3.js)标准创建漂亮的交互式图表,例如,可以缩放以更详细地检查某些区域。一个非常方便的库,可以使用 Python 创建这样的 D3.js 图表,是plotly。一个小的附加库,称为Cufflinks,将plotlypandasDataFrame对象紧密集成,可以创建最受欢迎的金融图表(如蜡烛图)

本章主要涵盖以下主题:

“静态 2D 绘图”

本节介绍了matplotlib,并呈现了一些典型的 2D 绘图,从最简单的到具有两个比例尺或不同子图的更高级的绘图。

“静态 3D 绘图”

基于matplotlib,介绍了一些在特定金融应用中有用的 3D 绘图。

“交互式 2D 绘图”

本节介绍了plotlyCufflinks,用于创建交互式 2D 绘图。利用CufflinksQuantFigure功能,本节还涉及典型的金融绘图,例如在技术股票分析中使用的绘图。

本章无法全面涵盖使用Pythonmatplotlibplotly进行数据可视化的所有方面,但它提供了这些包在金融领域的基本和重要功能的一些示例。其他示例也可以在后面的章节中找到。例如,第八章更深入地介绍了如何使用pandas库可视化金融时间序列数据。

静态 2D 绘图

在创建样本数据并开始绘图之前,首先进行一些导入和自定义:

In [1]: import matplotlib as mpl  # ①
In [2]: mpl.__version__  # ②
Out[2]: '2.0.2'
In [3]: import matplotlib.pyplot as plt  # ④
In [4]: plt.style.use('seaborn')  # ⑤
In [5]: mpl.rcParams['font.family'] = 'serif'  # ③
In [6]: %matplotlib inline

使用常见缩写mpl导入了matplotlib

使用的matplotlib版本。

将所有图的字体设置为serif

使用常见缩写plt导入了主要的绘图(子)包。

将绘图样式设置为seaborn(请参阅,例如,此处的概述)。

一维数据集

在接下来的所有内容中,我们将绘制存储在NumPyndarray对象或pandasDataFrame对象中的数据。然而,matplotlib当然也能够绘制存储在不同Python格式中的数据,比如list对象。最基本但相当强大的绘图函数是plt.plot()。原则上,它需要两组数字:

  • x:包含x坐标(横坐标值)的列表或数组
  • y:包含y坐标(纵坐标值)的列表或数组

提供的xy值的数量必须相匹配,当然了。考虑下面的代码,其输出如图 7-1 所示。

In [7]: import numpy as np
In [8]: np.random.seed(1000)  # ①
In [9]: y = np.random.standard_normal(20)  # ②
In [10]: x = np.arange(len(y))  # ③
         plt.plot(x, y);  # ④
         # plt.savefig('../../images/ch07/mpl_01')

为了可重复性,设置随机数生成器的种子。

绘制随机数(y 值)。

固定整数(x 值)。

使用xy对象调用plt.plot()函数。


图 7-1. 绘制给定的 x 和 y 值

plt.plot()注意到当您传递一个ndarray对象时。在这种情况下,无需提供x值的“额外”信息。如果您只提供y值,则plot将索引值视为相应的x值。因此,以下单行代码生成完全相同的输出(参见图 7-2):

In [11]: plt.plot(y);
         # plt.savefig('../../images/ch07/mpl_02')


图 7-2. 绘制给定的ndarray对象的数据

NumPy 数组和 matplotlib

您可以简单地将NumPyndarray对象传递给matplotlib函数。matplotlib能够解释数据结构以简化绘图。但是,请注意不要传递过大和/或复杂的数组。

由于大多数ndarray方法再次返回一个ndarray对象,因此您还可以通过附加方法(甚至在某些情况下可以是多个方法)来传递您的对象。通过在样本数据上调用cumsum()方法,我们得到了这些数据的累积和,正如预期的那样,得到了不同的输出(参见图 7-3):

In [12]: plt.plot(y.cumsum());
         # plt.savefig('../../images/ch07/mpl_03')


图 7-3. 绘制给定一个带有附加方法的ndarray对象

通常,默认的绘图样式不能满足报告、出版物等的典型要求。例如,您可能希望自定义使用的字体(例如,与LaTeX字体兼容),在轴上标记标签,或者绘制网格以提高可读性。这就是绘图样式发挥作用的地方(见上文)。此外,matplotlib提供了大量函数来自定义绘图样式。有些函数很容易访问;对于其他一些函数,需要深入挖掘。例如,很容易访问的是那些操作轴的函数以及与网格和标签相关的函数(参见图 7-4):

In [13]: plt.plot(y.cumsum())
         plt.grid(False);  # ①
         # plt.savefig('../../images/ch07/mpl_04')

关闭网格。


图 7-4。没有网格的图

plt.axis()的其他选项在表 7-1 中给出,其中大多数必须作为string对象传递。

表 7-1。plt.axis()的选项

参数 描述
返回当前轴限制
off 关闭轴线和标签
equal 导致等比例缩放
scaled 通过尺寸变化实现等比例缩放
tight 使所有数据可见(紧缩限制)
image 使所有数据可见(带有数据限制)
[xmin, xmax, ymin, ymax] 设置给定(列表的)值的限制

此外,您可以直接使用plt.xlim()plt.ylim()设置每个轴的最小和最大值。以下代码提供了一个示例,其输出显示在图 7-5 中:

In [14]: plt.plot(y.cumsum())
         plt.xlim(-1, 20)
         plt.ylim(np.min(y.cumsum()) - 1,
                  np.max(y.cumsum()) + 1);
         # plt.savefig('../../images/ch07/mpl_05')


图 7-5。带有自定义轴限制的图

为了更好地可读性,图表通常包含许多标签,例如标题和描述xy值性质的标签。这些分别通过函数plt.titleplt.xlabelplt.ylabel添加。默认情况下,plot绘制连续线条,即使提供了离散数据点。通过选择不同的样式选项来绘制离散点。图 7-6 叠加了(红色)点和(蓝色)线,线宽为 1.5 点:

In [15]: plt.figure(figsize=(10, 6))  # ①
         plt.plot(y.cumsum(), 'b', lw=1.5)  # ②
         plt.plot(y.cumsum(), 'ro')  # ③
         plt.xlabel('index')  # ④
         plt.ylabel('value')  # ⑤
         plt.title('A Simple Plot');  # ⑥
         # plt.savefig('../../images/ch07/mpl_06')

增加图的大小。

将数据绘制为蓝色线条,线宽为 1.5 点。

将数据绘制为红色(粗)点。

在 x 轴上放置一个标签。

在 y 轴上放置一个标签。

放置一个标题。


图 7-6。具有典型标签的图

默认情况下,plt.plot()支持表 7-2 中的颜色缩写。

表 7-2。标准颜色缩写

字符 颜色
b 蓝色
g 绿色
r 红色
c 青色
m 紫红色
y 黄色
k 黑色
w 白色

在线和/或点样式方面,plt.plot()支持表 7-3 中列出的字符。

表 7-3. 标准样式字符

字符 符号
- 实线型
-- 虚线型
-. 短划线-点线型
: 点线型
. 点标记
, 像素标记
o 圆形标记
v 向下三角形标记
–0— 向上三角形标记
< 向左三角形标记
> 向右三角形标记
1 向下三角形标记
2 向上三角形标记
3 向左三角形标记
4 向右三角形标记
s 正方形标记
p 五边形标记
–0— 星形标记
h 六边形 1 标记
H 六边形 2 标记
–0— 加号标记
x X 标记
D 菱形标记
d 窄菱形标记
`pass:[ ]`
垂直线标记 –0—

任何颜色缩写都可以与任何样式字符组合。通过这种方式,您可以确保不同的数据集易于区分。正如我们将看到的,绘图样式也将反映在图例中。

二维数据集

绘制一维数据可以被视为一种特殊情况。一般来说,数据集将由多个单独的数据子集组成。与 matplotlib  一维数据一样,处理这样的数据集遵循相同的规则。但是,在这种情况下可能会出现一些额外的问题。例如,两个数据集的缩放可能有如此之大的不同,以至于不能使用相同的  y 轴和/或 x  轴缩放绘制它们。另一个问题可能是您可能希望以不同的方式可视化两个不同的数据集,例如,通过线图绘制一个数据集,通过条形图绘制另一个数据集。

以下代码生成一个具有 20×2 形状的标准正态分布(伪随机)数字的NumPy ndarray对象的二维样本数据集。对这个数组,调用cumsum()方法来计算样本数据沿轴 0(即第一个维度)的累积和:

In [16]: y = np.random.standard_normal((20, 2)).cumsum(axis=0)

一般来说,您也可以将这样的二维数组传递给 plt.plot。然后,它将自动解释包含的数据为单独的数据集(沿着轴 1,即第二个维度)。相应的图示显示在图 7-7 中:

In [17]: plt.figure(figsize=(10, 6))
         plt.plot(y, lw=1.5)
         plt.plot(y, 'ro')
         plt.xlabel('index')
         plt.ylabel('value')
         plt.title('A Simple Plot');
         # plt.savefig('../../images/ch07/mpl_07')


图 7-7. 带有两个数据集的图

在这种情况下,进一步的注释可能有助于更好地阅读图表。您可以为每个数据集添加单独的标签,并在图例中列出它们。 plt.legend() 接受不同的位置参数。0 代表最佳位置,意味着图例尽可能少地遮挡数据。图 7-8 展示了两个数据集的图表,这次有了图例。在生成的代码中,我们现在不再将 ndarray 对象作为一个整体传递,而是分别访问两个数据子集(y[:, 0]y[:, 0]),这样可以为它们附加单独的标签:

In [18]: plt.figure(figsize=(10, 6))
         plt.plot(y[:, 0], lw=1.5, label='1st')  # ①
         plt.plot(y[:, 1], lw=1.5, label='2nd')  # ①
         plt.plot(y, 'ro')
         plt.legend(loc=0)  # ②
         plt.xlabel('index')
         plt.ylabel('value')
         plt.title('A Simple Plot');
         # plt.savefig('../../images/ch07/mpl_08')

为数据子集定义标签。

将图例放在最佳位置。

进一步的 plt.legend() 位置选项包括 表 7-4 中介绍的选项。

表 7-4. plt.legend() 的选项

位置 描述
自动
0 最佳位置
1 右上角
2 左上角
3 左下角
4 右下角
5
6 左中
7 右中
8 底部中心
9 上部中心
10 中心


图 7-8. 带标记数据集的图表

具有相似缩放的多个数据集,例如相同财务风险因素的模拟路径,可以使用单个 y 轴绘制。然而,通常数据集显示的缩放相差较大,并且使用单个 y  轴绘制此类数据通常会导致视觉信息的严重丢失。为了说明效果,我们将两个数据子集中的第一个缩放因子放大了 100 倍,并再次绘制数据(参见 图  7-9):

In [19]: y[:, 0] = y[:, 0] * 100  # ①
In [20]: plt.figure(figsize=(10, 6))
         plt.plot(y[:, 0], lw=1.5, label='1st')
         plt.plot(y[:, 1], lw=1.5, label='2nd')
         plt.plot(y, 'ro')
         plt.legend(loc=0)
         plt.xlabel('index')
         plt.ylabel('value')
         plt.title('A Simple Plot');
         # plt.savefig('../../images/ch07/mpl_09')

重新调整第一个数据子集的比例。


图 7-9. 具有两个不同缩放数据集的图表

检查 图 7-9 发现,第一个数据集仍然“视觉可读”,而第二个数据集现在看起来像是直线,因为 y 轴的新缩放。在某种意义上,第二个数据集的信息现在“视觉上丢失了”。解决这个问题有两种基本方法:

  • 使用两个 y 轴(左/右)
  • 使用两个子图(上/下,左/右)

让我们先将第二个 y 轴引入图表中。图 7-10 现在有了两个不同的 y 轴。左侧的 y 轴用于第一个数据集,而右侧的 y 轴用于第二个数据集。因此,也有了两个图例:

In [21]: fig, ax1 = plt.subplots()  # ①
         plt.plot(y[:, 0], 'b', lw=1.5, label='1st')
         plt.plot(y[:, 0], 'ro')
         plt.legend(loc=8)
         plt.xlabel('index')
         plt.ylabel('value 1st')
         plt.title('A Simple Plot')
         ax2 = ax1.twinx()  # ②
         plt.plot(y[:, 1], 'g', lw=1.5, label='2nd')
         plt.plot(y[:, 1], 'ro')
         plt.legend(loc=0)
         plt.ylabel('value 2nd');
         # plt.savefig('../../images/ch07/mpl_10')

定义 figureaxis 对象。

创建共享 x 轴的第二个 axis 对象。


图 7-10. 具有两个数据集和两个 y 轴的图表

关键代码行是帮助管理坐标轴的代码行。这些是接下来的代码行:

fig, ax1 = plt.subplots()
ax2 = ax1.twinx()

通过使用 plt.subplots() 函数,我们直接访问基础绘图对象(图形、子图等)。例如,它允许生成一个共享 x 轴的第二个子图。在图 7-10 中,我们实际上有两个子图叠加在一起。

接下来,考虑两个分离子图的情况。这个选项给予了更多处理两个数据集的自由,就像图 7-11 所示:

In [22]: plt.figure(figsize=(10, 6))
         plt.subplot(211)  # ①
         plt.plot(y[:, 0], lw=1.5, label='1st')
         plt.plot(y[:, 0], 'ro')
         plt.legend(loc=0)
         plt.ylabel('value')
         plt.title('A Simple Plot')
         plt.subplot(212)  # ②
         plt.plot(y[:, 1], 'g', lw=1.5, label='2nd')
         plt.plot(y[:, 1], 'ro')
         plt.legend(loc=0)
         plt.xlabel('index')
         plt.ylabel('value');
         # plt.savefig('../../images/ch07/mpl_11')

定义了上方子图 1。

定义了下方子图 2。


图 7-11. 具有两个子图的绘图

matplotlib figure 对象中子图的放置是通过使用特殊的坐标系统来完成的。plt.subplot() 接受三个整数作为参数,分别为 numrowsnumcolsfignum(用逗号分隔或不分隔)。numrows 指定的数量,numcols 指定的数量,而 fignum 指定子图的数量,从 1 开始,以 numrows * numcols 结束。例如,具有九个等大小子图的图形将具有 numrows=3numcols=3fignum=1,2,...,9。右下方的子图将具有以下“坐标”:plt.subplot(3, 3, 9)

有时,选择两种不同的图表类型来可视化这样的数据可能是必要的或者是期望的。通过子图的方法,您可以自由组合 matplotlib 提供的任意类型的图表。1 图 7-12 结合了线条/点图和柱状图:

In [23]: plt.figure(figsize=(10, 6))
         plt.subplot(121)
         plt.plot(y[:, 0], lw=1.5, label='1st')
         plt.plot(y[:, 0], 'ro')
         plt.legend(loc=0)
         plt.xlabel('index')
         plt.ylabel('value')
         plt.title('1st Data Set')
         plt.subplot(122)
         plt.bar(np.arange(len(y)), y[:, 1], width=0.5,
                 color='g', label='2nd')  # ①
         plt.legend(loc=0)
         plt.xlabel('index')
         plt.title('2nd Data Set');
         # plt.savefig('../../images/ch07/mpl_12')

创建一个 bar 子图。


图 7-12. 将线条/点子图与柱状子图组合的绘图


Python 金融编程第二版(三)(4)https://developer.aliyun.com/article/1559414

相关文章
|
1月前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!
|
1月前
|
存储 数据采集 人工智能
Python编程入门:从零基础到实战应用
本文是一篇面向初学者的Python编程教程,旨在帮助读者从零开始学习Python编程语言。文章首先介绍了Python的基本概念和特点,然后通过一个简单的例子展示了如何编写Python代码。接下来,文章详细介绍了Python的数据类型、变量、运算符、控制结构、函数等基本语法知识。最后,文章通过一个实战项目——制作一个简单的计算器程序,帮助读者巩固所学知识并提高编程技能。
|
23天前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
106 80
|
12天前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
33 14
|
21天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
57 2
|
1月前
|
小程序 开发者 Python
探索Python编程:从基础到实战
本文将引导你走进Python编程的世界,从基础语法开始,逐步深入到实战项目。我们将一起探讨如何在编程中发挥创意,解决问题,并分享一些实用的技巧和心得。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的参考。让我们一起开启Python编程的探索之旅吧!
50 10
|
1月前
|
机器学习/深度学习 人工智能 数据挖掘
探索Python编程的奥秘
在数字世界的海洋中,Python如同一艘灵活的帆船,引领着无数探险者穿梭于数据的波涛之中。本文将带你领略Python编程的魅力,从基础语法到实际应用,一步步揭开Python的神秘面纱。
45 12
|
1月前
|
IDE 程序员 开发工具
Python编程入门:打造你的第一个程序
迈出编程的第一步,就像在未知的海洋中航行。本文是你启航的指南针,带你了解Python这门语言的魅力所在,并手把手教你构建第一个属于自己的程序。从安装环境到编写代码,我们将一步步走过这段旅程。准备好了吗?让我们开始吧!
|
1月前
|
关系型数据库 开发者 Python
Python编程中的面向对象设计原则####
在本文中,我们将探讨Python编程中的面向对象设计原则。面向对象编程(OOP)是一种通过使用“对象”和“类”的概念来组织代码的方法。我们将介绍SOLID原则,包括单一职责原则、开放/封闭原则、里氏替换原则、接口隔离原则和依赖倒置原则。这些原则有助于提高代码的可读性、可维护性和可扩展性。 ####
|
1月前
|
人工智能 数据挖掘 开发者
探索Python编程之美:从基础到进阶
本文是一篇深入浅出的Python编程指南,旨在帮助初学者理解Python编程的核心概念,并引导他们逐步掌握更高级的技术。文章不仅涵盖了Python的基础语法,还深入探讨了面向对象编程、函数式编程等高级主题。通过丰富的代码示例和实践项目,读者将能够巩固所学知识,提升编程技能。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的参考和启示。让我们一起踏上Python编程的美妙旅程吧!