量化交易实战【1】自己搭建一个的股票交易回测框架,并通过均线择时策略进行回测

简介: 量化交易实战【1】自己搭建一个的股票交易回测框架,并通过均线择时策略进行回测

前言


本文介绍了一个股票交易的基础回测框架,并且通过均线择时策略,详细的演示了策略搭建的过程,和大家共同学习交流。


  1. 文章示例中使用的‘000001.XSHE.csv’文件,已上传至csdn资源中,可直接下载


  1. 或者关注文末公众号:‘阿旭算法与机器学习’。然后输入:股票数据,即可获取4000多只股票从2015年1月至2022年10月的所有基础数据


1. 导入数据


import pandas as pd
import matplotlib.pyplot as plt


pd.set_option('display.max_columns', None) # 展示所有列
# 000001.XSHE.csv文件包含2015年1月至2022年10月的开盘价、收盘价、最高价、最低价、成交量、成交金额股票的基本数据
df = pd.read_csv('./000001.XSHE.csv')  
df.head()

image.png


# 求该股票每日涨跌幅
df['change_pct'] = df['close'].pct_change()
df = df[['date','open','close','high','low','change_pct']]
df['date'] = pd.to_datetime(df['date'])  # 将交易日期字符串变为日期类型
df.head()


image.png


2. 交易框架搭建–以均线策略为例


当短期均线由下向上穿过长期均线的时候,第二天以开盘价全仓买入并在之后一直持有;


当短期均线由上向下穿过长期均线的时候,第二天以开盘价全仓卖出,之后空仓,直到下次买入


2.1 计算均线数值


此处以短期均线MA=5;长期均线MA=20为例进行说明,至于参数的优化,需要依据不同股票的实际情况修改


# 计算均线
ma_short = 5  #短期均线,ma代表:moving_average
ma_long = 20  #长期均线,ma代表:moving_average
df['ma_short'] = df['close'].rolling(ma_short).mean()
df['ma_long'] = df['close'].rolling(ma_long).mean()
df.head(10)


image.png


#补全上面均线缺失值:补全方式采用扩展窗口函数expanding,移动计算前面所有值之和的均值
df['ma_short'].fillna(value=df['close'].expanding().mean(),inplace=True)
df['ma_long'].fillna(value=df['close'].expanding().mean(),inplace=True)
df.head(10)


image.png


2.2 产生交易信号:即找出买入与卖出信号


# 找买入信号
# 当天的短期均线大于等于长期均线
condition1 = (df['ma_short'] >= df['ma_long'])
# 上一个交易日的短期均线小于长期均线
condition2 = (df['ma_short'].shift(1) < df['ma_long'].shift(1))
# 将买入信号当天的signal设为1
df.loc[condition1 & condition2, 'signal'] = 1
# 找卖出信号
# 当天的短期均线小于等于长期均线
condition1 = (df['ma_short'] <= df['ma_long'])
# 上一个交易日的短期均线大于长期均线
condition2 = (df['ma_short'].shift(1) > df['ma_long'].shift(1))
# 将买入信号当天的signal设为0
df.loc[condition1 & condition2,'signal'] = 0
# 浏览产生交易信号的日期
df[df['signal'].notnull()].head(10)

image.png


2.3 由交易信号计算每天股票仓位


我们用1表示满仓,0表示空仓。当出现买入信号之后,全仓买入,当出现卖出信号之后,全仓卖出。


因此,当交易信号signal为1时,第二天仓位position也会变为1,之后的仓位一直为1,直到出现卖出信号,仓位变为0。


注意:此处因为signal的计算运用了收盘价,是每天收盘之后产生的信号,所以仓位position在第二天才会发生改变。

例如2015-05-01产生买入信号,2015-05-02仓位才会变成1,满仓用1表示,空仓用0表示

将signal信号下移一格,表示第二天买入,用1表示满仓,0表示空仓


# 新建列Pos表示仓位,将交易信号下移一格,表示第二天买入,1表示满仓,0表示空仓
df['pos'] = df['signal'].shift()
# 向上填充,将买入之后的pos全部设置为1
df['pos'].fillna(method='ffill', inplace=True)
# 没有买入的pos全部设置为0
df['pos'].fillna(value=0,inplace=True)
# 预览仓位数据
df[(df['date']>='2015-02-24')&(df['date']<'2015-05-06')][['date','signal','pos']].head(20)


image.png


2.4 排除当天开盘就涨跌停导致无法交易的情况,此时仓位不能改变


注意:开盘涨跌停,是基本无法买入或者卖出股票的。


# 找出开盘涨停的日期:即今天的开盘价相对于昨天的收盘价上涨了9.7%以上,此处不用10%是因为由于4舍5入,涨停不一定就是10%
cond_cannot_buy = df['open'] > df['close'].shift(1) * 1.097
# 将开盘涨停且当前position为1时的'pos'设为空值
df.loc[cond_cannot_buy & (df['pos'] == 1),'pos'] = None
# 找出开盘跌停的日期,即今天的开盘价相对于昨天的收盘价跌了9.7%(1-0.097=0.903)
cond_cannot_sell = df['open'] < df['close'].shift(1) *0.903
# 将开盘跌停且当前position为0时的'pos'设为空值
df.loc[cond_cannot_sell & (df['pos'] == 0),'pos'] = None
# position为空的日期表示不能买卖。position仓位只能和前一个交易日保持一致
df['pos'].fillna(method='ffill', inplace=True)


2.5 计算资金曲线并绘图


# 资金曲线:假设起始资金为100万元的每天资金变化情况
# 首先计算资金曲线每天的涨跌幅,‘equity_change’表示资金每天的涨跌幅
# 当天空仓时,pos为0,资产涨幅为0
# 当天满仓时,pos为1,资产涨幅为股票本身的涨跌幅
df['equity_change'] = df['change_pct'] * df['pos']
# 根据每天的涨跌幅计算资金曲线
df['equity_curve'] = 1000000 * (df['equity_change'] + 1).cumprod()
df = df[['date' , 'change_pct','pos','equity_change','equity_curve']]
df.reset_index(inplace=True, drop=True)  # 重置索引,让他从0开始
df.head(10)


image.png


# 绘制资金曲线
plt.plot(df['equity_curve'])
plt.show()

b7ead3d7595a4976909feb112761e574.png


通过资金曲线我们可以看到,该只股票从2015年1月开始至今,通过该策略最高是1.8倍收益,后面又跌回去了…


当然这个策略只是在此处搭建框架做演示用的,实际策略参数等都需要根据具体情况进行调整。


3. 总结


本文详细的介绍了通过股票数据及均线策略构建股票回测框架的过程:


  1. 导入数据,计算涨跌幅


  1. 通过均线策略产生交易信号


  1. 通过交易信号计算每天仓位


  1. 排除涨跌停无法进行交易的情况


  1. 通过仓位计算每天资金曲线,回测


对于其他择时交易策略,我们只需更改上述框架中的交易信号产生部分,就可以实现回测啦。


后续待改进的地方,本文在计算资金曲线的过程中,没有考虑交易手续费,买入时的价格与当天涨幅不匹配(当天开盘价买入,资金涨幅与当天股票涨幅不是同等的)等问题,下期会写一个实际操作过程中的资金曲线,将这些问题包含进去。如果有不对的地方,欢迎提出来共同学习交流,谢谢!

如果内容对你有帮助,记得点赞、关注哦!也欢迎小伙伴们和我共同学习交流。


更多干货内容持续更新中…


相关文章
|
3月前
|
机器学习/深度学习 数据可视化 算法
数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律
本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节,分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手,介绍如何通过Python代码实现分布特征的初步观察,并系统化地讲解参数估计、统计检验及distfit库的应用。同时,针对离散数据、非参数方法和Bootstrap验证等专题展开讨论,强调业务逻辑与统计结果结合的重要性。最后指出,正确识别分布有助于异常检测、数据生成及预测分析等领域,为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性,重视对数据本质的理解。
291 3
数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律
|
存储 Web App开发 JSON
OpenTelemetry Log规范解读
本文主要介绍OpenTelemetry Log规范,这一规范来自于Google、Microsoft、AWS、Splunk、DataDog、ES、Fluntd等众多优秀的公司和项目成员,其中有很多点是我们在平时开发、运维需要关注的知识和经验,值得大家一观。
6673 0
OpenTelemetry Log规范解读
|
10月前
|
机器学习/深度学习 监控 机器人
量化交易机器人系统开发逻辑策略及源码示例
量化交易机器人是一种通过编程实现自动化交易决策的金融工具。其开发流程包括需求分析、系统设计、开发实现、测试优化、部署上线、风险管理及数据分析。示例中展示了使用Python实现的简单双均线策略,计算交易信号并输出累计收益率。
|
Linux 数据安全/隐私保护 Windows
更换(Pypi)pip源到国内镜像
pip国内的一些镜像 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.
247099 2
|
10月前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
456 5
|
机器学习/深度学习 数据采集 API
|
Rust 前端开发 JavaScript
用 Rust 打包网页生成很小的桌面 App
Pake 支持 Mac / Windows / Linux 系统,常用包下载、命令行一键打包、定制开发。
|
Oracle Java 关系型数据库
Java官网下载JDK21版本详细教程(下载、安装、环境变量配置)
Java官网下载JDK21版本详细教程(下载、安装、环境变量配置)
|
SQL Java 大数据
5款开源BI工具优缺点及介绍
【4月更文挑战第15天】对比了几款开源BI报表工具:Superset以其高性能和高度可定制化受青睐,适合复杂分析;Metabase以其简洁易用和广泛兼容性脱颖而出,适合快速构建报表;DataEase以其轻量级和易部署特点吸引中小型企业;JasperReports擅长复杂报表生成,适合Java环境;Pentaho CE则是一体化平台,适合需要全面企业级功能的用户。选择时应结合公司需求、技术背景和数据规模来决定。
4638 6
|
数据挖掘 API 数据处理
Python实现简易股票交易系统
Python实现简易股票交易系统
547 1

热门文章

最新文章