python股票量化交易(6)---使用TA-Lib计算技术指标

简介: python股票量化交易(6)---使用TA-Lib计算技术指标

什么是TA-Lib


TA-Lib(Technical Analysis Library)是python提供的开源技术分析库,自发布以来,已经有20多年的历史,它包含了大约200个技术指标的计算函数和K线形态识别函数,例如MACD、RSI、KDJ、动量指标等。


我们从前面的几篇博文分析来看,如果你不了解这个库,我们直接分析股票的话,你需要完全记住所有指标的计算公式,对于数学不怎么好的人,实在不友好。但是我们有了TA-Lib库之后,就可以很方便的得到指标绘制的一些参数,这样可以大大节省我们的分析时间。


所以,本篇博文将讲解前面所有技术指标,通过TA-Lib库计算出来。那么我们首先,需要在python文件中导入这个库,具体代码如下:

import talib


SMA指标的计算


SMA也就是前面博文中讲解的均线,即simple moving average的缩写,TA-Lib库直接提供给我们talib.SMA()进行计算SMA。


使用SMA()函数有两个参数:


(1)timeperiod:也就是计算均线的时间,比如5日均线就写5,10日均线就写10,以此类推。


(2)close:收盘价,通过pandas直接导入收盘价那一列即可。


下面,我们来通过SMA()函数计算10,20,30日均线,具体代码如下所示:

import pandas as pd
import talib
df = pd.read_excel("牧原股份.xlsx")
df["SMA10"]=talib.SMA(df['close'],timeperiod=10)
df["SMA20"]=talib.SMA(df['close'],timeperiod=20)
df["SMA30"]=talib.SMA(df['close'],timeperiod=30)


不过这里我们需要注意,在计算均线之时,必定均线前n天是空值。比如这里计算10日均线,那么前9日是没有值的。而没有值默认会填充NaN,为了绘图时的数据好看,我们需要将这前N天的空白值赋值为第一天均线的有效值,这样看起来就会有空白的曲线。具体代码如下所示:

df['SMA10'].fillna(method="bfill",inplace=True)
df['SMA20'].fillna(method="bfill",inplace=True)
df['SMA30'].fillna(method="bfill",inplace=True)


当前,我们的均线其实还有很多不同的计算方法,比如计算指数移动平均值时,用的是EMA方法,而计算加权移动平均值时,计算的是WMA方法。不过,这些这些计算都有一个通用的方法MA,它通过最后一个参数matype区分是计算EMA,还是WMA,或者SMA。例如:

df['ma10']=talib.MA(df['close'],timeperiod=10,matype=0)
df['ma20']=talib.MA(df['close'],timeperiod=20,matype=1)
df['ma30']=talib.MA(df['close'],timeperiod=30,matype=2)


0代表SMA,1代表EMA,2代表WMA,其他的参数数值,后面讲解其他指标时我们在介绍,这三个为最常用的方法,需要记住。


完整绘制均线的代码如下:

import pandas as pd
import talib
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
fig = plt.figure(figsize=(12, 8))
ax = fig.add_subplot(111)
df = pd.read_excel("牧原股份.xlsx")
df['date'] = pd.to_datetime(df['date'])
df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m-%d'))
df["SMA10"]=talib.SMA(df['close'],timeperiod=10)
df["SMA20"]=talib.SMA(df['close'],timeperiod=20)
df["SMA30"]=talib.SMA(df['close'],timeperiod=30)
df['SMA10'].fillna(method="bfill",inplace=True)
df['SMA20'].fillna(method="bfill",inplace=True)
df['SMA30'].fillna(method="bfill",inplace=True)
ax.plot(np.arange(0, len(df)), df['SMA10'])  # 绘制5日均线
ax.plot(np.arange(0, len(df)), df['SMA20'])  # 绘制10日均线
ax.plot(np.arange(0, len(df)), df['SMA30'])  # 绘制30日均线
ax.xaxis.set_major_locator(ticker.MaxNLocator(20))
def format_date(x, pos=None):
    if x < 0 or x > len(df['date']) - 1:
        return ''
    return df['date'][int(x)]
ax.xaxis.set_major_formatter(ticker.FuncFormatter(format_date))
plt.setp(plt.gca().get_xticklabels(), rotation=45, horizontalalignment='right')
plt.show()


运行之后,显示效果如下图所示:


MACD指标的计算


既然TA-Lib库直接提供了SMA()方法计算均线,那么肯定也会有MACD方法提供给你计算MACD的参数。具体的使用方法如下:

dif, dea, bar = talib.MACD(df['close'].values, fastperiod=12, slowperiod=26, signalperiod=9)

可以看到,前面计算MACD参数之时,我们会计算EMA1(12日收盘价移动平均线)与EMA2(26收盘价移动平均线)对应的就是上面的12,26。同样的,计算DEA的公式span也为9,代入最后一个值。


不过,其内部实现与我们自己按公式操作其实是一样的步骤,只是TA-Lib库直接省略步骤,把方法直接给我们了,这样如果只是用于分析,多数开发者并不需要了解其原理。


虽然说它直接提供给我们计算方法MACD(),但是我们按前面公式计算是没有空值的,这里直接代码会造成空值的情况。所以我们需要额外的步骤将空值替换掉,具体代码如下:

dif[np.isnan(dif)],dea[np.isnan(dea)],bar[np.isnan(bar)]=0,0,0

完整的绘图代码如下所示:

import pandas as pd
import talib
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
fig = plt.figure(figsize=(12, 8))
ax = fig.add_subplot(111)
df = pd.read_excel("牧原股份.xlsx")
df['date'] = pd.to_datetime(df['date'])
df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m-%d'))
dif, dea, bar = talib.MACD(df['close'].values, fastperiod=12, slowperiod=26, signalperiod=9)
dif[np.isnan(dif)], dea[np.isnan(dea)], bar[np.isnan(bar)] = 0, 0, 0
ax.plot(np.arange(0, len(df)), dif)
ax.plot(np.arange(0, len(df)), dea)
red_bar = np.where(bar > 0, 2 * bar, 0)
blue_bar = np.where(bar < 0, 2 * bar, 0)
ax.bar(np.arange(0, len(df)), red_bar, color="red")
ax.bar(np.arange(0, len(df)), blue_bar, color="blue")
ax.xaxis.set_major_locator(ticker.MaxNLocator(20))
def format_date(x, pos=None):
    # 由于前面股票数据在 date 这个位置传入的都是int
    # 因此 x=0,1,2,...
    # date_tickers 是所有日期的字符串形式列表
    if x < 0 or x > len(df['date']) - 1:
        return ''
    return df['date'][int(x)]
ax.xaxis.set_major_formatter(ticker.FuncFormatter(format_date))
plt.setp(plt.gca().get_xticklabels(), rotation=45, horizontalalignment='right')
plt.show()


运行之后,显示效果如下所示:


KDJ指标的计算


虽然说计算SMA与MACD的方法名在TA-Lib库中是一致的,但是这次还真不是KDJ函数。在TA-Lib库中计算KDJ的方法为talib.STOCH函数。首先,我们可以通过该函数计算出K、D的值,然后通过K、D计算出J值,具体的计算方式如下:

df['K'], df['D'] = talib.STOCH(df['high'].values, df['low'].values, df['close'].values, fastk_period=9, slowk_period=3,
                               slowk_matype=0, slowd_period=3, slowd_matype=0)
df['K'].fillna(0,inplace=True)
df['D'].fillna(0,inplace=True)
df['J']=3*df['K']-2*df['D']


这里fastk_period=9,slowk_period=3,slowd_period=3,虽然计算方式不同,但核心思想是一致的。同样的,使用TA-Lib库计算出来的KD值也有无效值,需要用0进行替换。


完整的绘制KDJ曲线代码如下:

import pandas as pd
import talib
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
fig = plt.figure(figsize=(12, 8))
ax = fig.add_subplot(111)
df = pd.read_excel("牧原股份.xlsx")
df['date'] = pd.to_datetime(df['date'])
df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m-%d'))
df['K'], df['D'] = talib.STOCH(df['high'].values, df['low'].values, df['close'].values, fastk_period=9, slowk_period=3,
                               slowk_matype=0, slowd_period=3, slowd_matype=0)
df['K'].fillna(0,inplace=True)
df['D'].fillna(0,inplace=True)
df['J']=3*df['K']-2*df['D']
ax.plot(df["date"], df["K"], label ="K")
ax.plot(df["date"], df["D"], label ="D")
ax.plot(df["date"], df["J"], label ="J")
plt.legend()
ax.xaxis.set_major_locator(ticker.MaxNLocator(20))
def format_date(x, pos=None):
    # 由于前面股票数据在 date 这个位置传入的都是int
    # 因此 x=0,1,2,...
    # date_tickers 是所有日期的字符串形式列表
    if x < 0 or x > len(df['date']) - 1:
        return ''
    return df['date'][int(x)]
ax.xaxis.set_major_formatter(ticker.FuncFormatter(format_date))
plt.setp(plt.gca().get_xticklabels(), rotation=45, horizontalalignment='right')
plt.show()


运行之后,显示效果如下所示:

相关文章
|
30天前
|
Python
【10月更文挑战第10天】「Mac上学Python 19」小学奥数篇5 - 圆和矩形的面积计算
本篇将通过 Python 和 Cangjie 双语解决简单的几何问题:计算圆的面积和矩形的面积。通过这道题,学生将掌握如何使用公式解决几何问题,并学会用编程实现数学公式。
160 60
|
7天前
|
算法 Python
Python图论探索:从理论到实践,DFS与BFS遍历技巧让你秒变技术大牛
图论在数据结构与算法中占据重要地位,应用广泛。本文通过Python代码实现深度优先搜索(DFS)和广度优先搜索(BFS),帮助读者掌握图的遍历技巧。DFS沿路径深入搜索,BFS逐层向外扩展,两者各具优势。掌握这些技巧,为解决复杂问题打下坚实基础。
16 2
|
8天前
|
开发框架 开发者 Python
探索Python中的装饰器:技术感悟与实践
【10月更文挑战第31天】 在编程世界中,装饰器是Python中一种强大的工具,它允许我们在不修改函数代码的情况下增强函数的功能。本文将通过浅显易懂的方式,带你了解装饰器的概念、实现原理及其在实际开发中的应用。我们将一起探索如何利用装饰器简化代码、提高可读性和复用性,同时也会分享一些个人的技术感悟,帮助你更好地掌握这项技术。
22 2
|
13天前
|
机器学习/深度学习 算法 编译器
Python程序到计算图一键转化,详解清华开源深度学习编译器MagPy
【10月更文挑战第26天】MagPy是一款由清华大学研发的开源深度学习编译器,可将Python程序一键转化为计算图,简化模型构建和优化过程。它支持多种深度学习框架,具备自动化、灵活性、优化性能好和易于扩展等特点,适用于模型构建、迁移、部署及教学研究。尽管MagPy具有诸多优势,但在算子支持、优化策略等方面仍面临挑战。
35 3
|
13天前
|
数据采集 Web App开发 iOS开发
如何利用 Python 的爬虫技术获取淘宝天猫商品的价格信息?
本文介绍了使用 Python 爬虫技术获取淘宝天猫商品价格信息的两种方法。方法一使用 Selenium 模拟浏览器操作,通过定位页面元素获取价格;方法二使用 Requests 和正则表达式直接请求页面内容并提取价格。每种方法都有详细步骤和代码示例,但需注意反爬措施和法律法规。
|
13天前
|
数据采集 存储 Web App开发
利用Python 的爬虫技术淘宝天猫销量和库存
使用 Python 爬虫技术获取淘宝天猫商品销量和库存的步骤包括:1. 安装 Python 和相关库(如 selenium、pandas),下载浏览器驱动;2. 使用 selenium 登录淘宝或天猫;3. 访问商品页面,分析网页结构,提取销量和库存信息;4. 处理和存储数据。注意网页结构可能变化,需遵守法律法规。
|
15天前
|
数据库 开发者 Python
“Python异步编程革命:如何从编程新手蜕变为并发大师,掌握未来技术的制胜法宝”
【10月更文挑战第25天】介绍了Python异步编程的基础和高级技巧。文章从同步与异步编程的区别入手,逐步讲解了如何使用`asyncio`库和`async`/`await`关键字进行异步编程。通过对比传统多线程,展示了异步编程在I/O密集型任务中的优势,并提供了最佳实践建议。
16 1
|
24天前
|
Python
【10月更文挑战第15天】「Mac上学Python 26」小学奥数篇12 - 图形变换与坐标计算
本篇将通过 Python 和 Cangjie 双语实现图形变换与坐标计算。这个题目帮助学生理解平面几何中的旋转、平移和对称变换,并学会用编程实现坐标变化。
62 1
|
28天前
|
机器学习/深度学习 移动开发 Python
【10月更文挑战第11天】「Mac上学Python 22」小学奥数篇8 - 排列组合计算
本篇将通过 Python 和 Cangjie 双语讲解如何计算排列与组合。这道题目旨在让学生学会使用排列组合公式解决实际问题,并加深对数学知识和编程逻辑的理解。
59 4
|
28天前
|
数据可视化 Python
【10月更文挑战第12天】「Mac上学Python 23」小学奥数篇9 - 基础概率计算
本篇将通过 Python 和 Cangjie 双语实现基础概率的计算,帮助学生学习如何解决简单的概率问题,并培养逻辑推理和编程思维。
47 1