前言
都说2020年是牛市的起点,很显然对于数据来说,程序员具有绝对的优势,因为大多数程序员一辈子都在跟数据在打交道,而程序员只要掌握了数据的处理以及图表的绘制,就可以在股市中游刃有余。
但是,股票量化交易专栏并不是介绍基础的,而只讲解股票相关的知识。所以,对matplotlib图表绘制以及numpy,pandas库,我们不会做过多的介绍,需要看此类博客,还需要这3个基础知识。下面,我们直接进入正题。
获取股票的数据
对于python语言来说,有很多获取股票的操作库,比如akshare、baostock以及tushare库。而这3个股票数据获取库都是大同小异,所以这里小编后续章节都是基于akshare库进行股票数据的获取。话不多说,我们来看看如何获取近1个月的股票数据。代码如下所示:
import akshare as ak def get_codeData(code="sz002241"): df = ak.stock_zh_a_daily(symbol=code, start_date="20201203", end_date="20210115", adjust="qfq") df.to_excel("歌尔股份k.xlsx")
如上面代码所示,我们使用stock_zh_a_daily方法获取一段时间的数据,这里的日期可以根据你的需求进行调整,比如设置start_date=“20200101”,end_date=“20210101”,就可以获取一年时间段的股票数据。
而股票的代码有sh与sz之分,sz代表深市的股票,所有深市的股票前面都必须带上sz,比如这里的歌尔股份,就是sz002241。同样的,sh是上证交易所的股票,所有上证的股票前面必须带上sh。
这里,我们来看看获取的股票数据格式,如下图所示:
date:交易日期
open:代表开盘价
high:当天最高价
low:当天最低价
close:当天收盘价
volume:当天成交量(元)
outstanding_share:流动股本(股)
turnover:换手率
既然已经拿到了数据,下面我们来绘制K线图。
绘制K线图
在python中,绘制K线图需要用到mpl_finance库,而这个库提供了4种方式绘制K线图,这里我们介绍其中的一种,代码如下所示:
import mpl_finance as mpf import matplotlib.pyplot as plt import pandas as pd #创建绘图的基本参数 fig=plt.figure(figsize=(12, 8)) ax=fig.add_subplot(111) #获取刚才的股票数据 df = pd.read_excel("歌尔股份k.xlsx") mpf.candlestick2_ochl(ax, df["open"], df["close"], df["high"], df["low"], width=0.6, colorup='r',colordown='green',alpha=1.0) #显示出来 plt.show()
运行此段代码后,会显示如下效果图:
这个K线图有一个问题,就是X坐标轴并不是显示的时间,而是数字,这是因为我们绘制K线图的方法,并没有提供X轴的参数,那怎么让下面的数字替换为时间呢?我们先来看一段代码:
import matplotlib.ticker as ticker #将股票时间转换为标准时间,不带时分秒的数据 def date_to_num(dates): num_time = [] for date in dates: date_time = datetime.strptime(date, '%Y-%m-%d') num_date = date2num(date_time) num_time.append(num_date) return num_time #创建绘图的基本参数 fig=plt.figure(figsize=(12, 8)) ax=fig.add_subplot(111) #获取刚才的股票数据 df = pd.read_excel("歌尔股份k.xlsx") mpf.candlestick2_ochl(ax, df["open"], df["close"], df["high"], df["low"], width=0.6, colorup='r',colordown='green',alpha=1.0) df['date'] = pd.to_datetime(df['date']) df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m-%d')) def format_date(x, pos=None): if x < 0 or x > len(df['date']) - 1: return '' return df['date'][int(x)] ax.xaxis.set_major_formatter(ticker.FuncFormatter(format_date)) plt.setp(plt.gca().get_xticklabels(), rotation=45, horizontalalignment='right') #显示出来 plt.show()
这里,我们定义了2个方法:第1个方法date_to_num主要的作用就是将获取的时间数据转换为标准的日期数据;第2个方法,就是根据X的数值替换时间值。
其中,set_major_formatter方法是将数值替换为时间值的操作库,而plt.setup的功能就是设置X轴的标签倾斜45度以及右对齐。运行之后,我们的K线图就显示的非常完美了,如下图所示:
均线图
虽然我们实现了K线图,但是有没有发现,其实大多数的股票交易软件K线图上面其实还标记有均线,比如常用的有5日均线,10日均线,30均线。所以,我们需要将均线一起添加到我们的K线图之上。计算均线的方式如下:
df["SMA5"] = df["close"].rolling(5).mean() df["SMA10"] = df["close"].rolling(10).mean() df["SMA30"] = df["close"].rolling(30).mean()
3行代码就可以获取到股票的均线值。接着,我们可以使用上面的ax进行绘制均线了,添加的代码如下所示:
ax.plot(np.arange(0, len(df)), df['SMA5']) # 绘制5日均线 ax.plot(np.arange(0, len(df)), df['SMA10']) # 绘制10日均线 ax.plot(np.arange(0, len(df)), df['SMA30']) # 绘制30日均线
这里,同样将X轴设置为数字,将这两段代码添加到上面的K线图代码中,自然也会将X轴替换为时间。运行之后,显示效果如下图所示:
这里5日均线为蓝色,10日均线为橙色,30日均线为绿色,如果需要自己设置颜色,可以在每条均线的的绘制方法中加入color参数。
细心的读者肯定发现30日均线只有最后一小段,这是因为前29日不够30日是算不出均线的,同样的5,10日均线也是如此。
成交量
最后,我们还需要绘制成交量。在多数的股票交易软件中,上面是K线图,一般下面对应的就是成交量,这样对比起来看,往往能直观的看到数据的变化。
但是,因为上面有个K线图,那么同一个画布中就有了2个图片,且它们共用一个X轴,那么我们需要更改一下基本的参数,代码如下所示:
import mpl_finance as mpf import matplotlib.pyplot as plt import pandas as pd import matplotlib.ticker as ticker import numpy as np #创建绘图的基本参数 fig, axes = plt.subplots(2, 1, sharex=True, figsize=(15, 10)) ax1, ax2 = axes.flatten() #获取刚才的股票数据 df = pd.read_excel("歌尔股份k.xlsx") mpf.candlestick2_ochl(ax1, df["open"], df["close"], df["high"], df["low"], width=0.6, colorup='r',colordown='green',alpha=1.0) df['date'] = pd.to_datetime(df['date']) df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m-%d')) def format_date(x, pos=None): if x < 0 or x > len(df['date']) - 1: return '' return df['date'][int(x)] df["SMA5"] = df["close"].rolling(5).mean() df["SMA10"] = df["close"].rolling(10).mean() df["SMA30"] = df["close"].rolling(30).mean() ax1.plot(np.arange(0, len(df)), df['SMA5']) # 绘制5日均线 ax1.plot(np.arange(0, len(df)), df['SMA10']) # 绘制10日均线 ax1.plot(np.arange(0, len(df)), df['SMA30']) # 绘制30日均线 ax1.xaxis.set_major_formatter(ticker.FuncFormatter(format_date)) plt.setp(plt.gca().get_xticklabels(), rotation=45, horizontalalignment='right') #显示出来 plt.show()
这里,我们将绘图的画布设置为2行1列。同时,将上面绘制的所有数据都更改为ax1,这样均线与K线图会绘制到第一个子图中。
接着,我们需要绘制成交量,但是我们知道,一般股票交易软件都将上涨的那天成交量设置为红色,而将下跌的成交量绘制成绿色。所以,首先我们要做的是将获取的股票数据根据当天的涨跌情况进行分类。具体代码如下:
red_pred = np.where(df["close"] > df["open"], df["volume"], 0) blue_pred = np.where(df["close"] < df["open"], df["volume"], 0)
如上面代码所示,我们通过np.where(condition, x, y)筛选数据。这里满足条件condition,输出X,不满足条件输出Y,这样我们就将涨跌的成交量数据进行了分类。
最后,我们直接通过柱状图方法绘制成交量,具体代码如下所示:
ax2.bar(np.arange(0, len(df)), red_pred, facecolor="red") ax2.bar(np.arange(0, len(df)), blue_pred, facecolor="blue")
将这4行代码,全部加入到plt.show()代码的前面即可。
运行之后,输出的效果图如下:
K线图、均线图与成交量就讲到这里,下一篇介绍震荡类指标KDJ的相关知识。