南洋理工发布量化交易大师TradeMaster,涵盖15种强化学习算法

简介: 南洋理工发布量化交易大师TradeMaster,涵盖15种强化学习算法


机器之心专栏

机器之心编辑部

南洋理工大学开发了一个基于强化学习的开源平台: TradeMaster— 交易大师。


近日,量化平台大家庭迎来了一位新成员,基于强化学习的开源平台: TradeMaster— 交易大师


TradeMaster 由南洋理工大学开发,是一个涵盖四大金融市场,六大交易场景,15 种强化学习算法以及一系列可视化评价工具的统一的,端到端的,用户友好的量化交易平台!

平台地址: https://github.com/TradeMaster-NTU/TradeMaster

背景介绍

近年来,人工智能技术在量化交易策略中正在占据越来越重要的地位。由于具有在复杂环境中突出的决策能力,将强化学习技术应用于量化交易中任务存在巨大的潜力。然而金融市场的低信噪比和强化学习算法训练不稳定的特点使得强化学习算法目前还无法大规模部署在真实金融市场中,具体挑战如下: 1. 开发流程复杂,包含极大的工程量,难以实现 2. 算法性能高度依赖于测试时的市场状态,风险较高,难以系统评价 3. 算法的设计,优化,和维护有存在较高的技术门槛,难以大规模部署。TradeMaster 的发布为这个领域提供了一款软件工具,一个行业基准和一类工业级产品接口以解决上文中的三个挑战。

TradeMaster 对于产学研用深度融合的潜在贡献

TradeMaster 框架

TradeMaster 由六个核心模块组成,包含了用于量化交易强化学习算法的设计,实现,测试,部署的完整流程,下面我们为大家具体介绍:

TradeMaster 平台的框架结构

数据模块:TradeMaster 提供了长周期多模态 (K 线和订单流) 不同粒度 (分钟级到日级) 的金融数据,涵盖四个主要市场:中国,美国股票,加密货币和外汇。

预处理模块:TradeMaster 提供了标准化的金融时序数据预处理的 pipeline,包含 6 个步骤:1. 数据清洗 2. 数据填充 3. 正则化 4. 自动特征发掘 5. 特征嵌入 6. 特征选择

模拟器模块:TradeMaster 提供了一系列的数据驱动的高质量金融市场模拟器,支持 6 个主流量化交易任务:1. 加密货币交易 2. 资产组合管理 3. 日内交易 4. 订单执行 5. 高频交易 6. 做市

算法模块:TradeMaster 实现了 7 个最新的基于强化学习的交易算法 ( DeepScalper,OPD,DeepTrader,SARL,ETTO,Investor-Imitator,EIIE ) 和 8 个经典强化算法 ( PPO,A2C,Rainbow,SAC,DDPG,DQN,PG,TD3 )。与此同时,TradeMaster 引入了自动化机器学习技术来帮助用户高效的调整训练强化学习算法的超参数。

评价模块:TradeMaster 实现了 17 个评价指标和可视化工具从收益能力,风险控制,多样性,可解释性,鲁棒性,通用型 6 个维度给出系统化的评价。以下是两个例子:

表示收益能力,风险控制,策略多样性的雷达图

金融时序数据可视化

运行流程伪代码
TradeMaster 基于面向对象的编程思想,对不同功能模块进行封装,实现了不同模块之前的功能解偶和封装,具有良好的可扩展性和复用性,具体流程包含如下 6 个步骤


测试结果

以道琼斯 30 指数上的投资组合这一经典任务为例,EIIE 算法在测试集上取得了稳定的正收益和较高的夏普比:



TradeMaster 教程

TradeMaster 提供了一系列针对多个金融市场不同交易任务的强化学习算法教程,通过 Jupyter Notebook 的形式呈现以方便用户快速上手:


详情见:https://github.com/TradeMaster-NTU/TradeMaster/tree/1.0.0/tutorial

基于 TradeMaster 的大型强化学习量化交易算法设计比赛将会在今年年内举行,以帮助大家更好的了解和使用 TradeMaster,尽情期待!

相关文章
|
8月前
|
机器学习/深度学习 存储 算法
【强化学习】常用算法之一 “DQN”
DQN算法是深度学习领域首次广泛应用于强化学习的算法模型之一。它于2013年由DeepMind公司的研究团队提出,通过将深度神经网络与经典的强化学习算法Q-learning结合,实现了对高维、连续状态空间的处理,具备了学习与规划的能力。本文对DQN算法进行了详细的讲解,包括发展史、算法公式和原理、功能、示例代码以及如何使用。DQN算法通过结合深度学习和Q-learning算法,实现了对高维、连续状态空间的处理,具备了学习和规划的能力。
884 0
【强化学习】常用算法之一 “DQN”
|
4月前
|
机器学习/深度学习 算法 Python
【Python强化学习】时序差分法Sarsa算法和Qlearning算法在冰湖问题中实战(附源码)
【Python强化学习】时序差分法Sarsa算法和Qlearning算法在冰湖问题中实战(附源码)
34 1
|
4月前
|
机器学习/深度学习 人工智能 算法
【PyTorch深度强化学习】TD3算法(双延迟-确定策略梯度算法)的讲解及实战(超详细 附源码)
【PyTorch深度强化学习】TD3算法(双延迟-确定策略梯度算法)的讲解及实战(超详细 附源码)
428 1
|
6月前
|
机器学习/深度学习 算法 自动驾驶
基于Qlearning强化学习的路径规划算法matlab仿真
基于Qlearning强化学习的路径规划算法matlab仿真
|
3月前
|
机器学习/深度学习 算法 算法框架/工具
OpenAI Gym 中级教程——深入强化学习算法
OpenAI Gym 中级教程——深入强化学习算法
175 6
|
8月前
|
机器学习/深度学习 存储 算法
【强化学习】常用算法之一 “Q-learning”
Q-learning算法是一种基于强化学习的无模型学习方法,通过学习到目标系统的Q值函数来解决智能体在给定环境下的最优决策策略问题。Q-learning算法是基于后验策略方法,即学习出目标系统的价值函数Q之后,通过使用某种策略来最大化该价值函数,称之为后验策略。Q-learning算法是偏差-方差权衡的算法,在偏差较高的情况下可以在基于模型的强化学习中找到一个接近最优策略的解决方案。同时它也具有较高的收敛速度和广泛的适用性,因为其只需要存储一个值函数,不需要存储模型。
268 0
【强化学习】常用算法之一 “Q-learning”
|
4月前
|
机器学习/深度学习 开发框架 .NET
【Python强化学习】马尔可夫决策过程与蒙特卡洛近似算法讲解(图文解释)
【Python强化学习】马尔可夫决策过程与蒙特卡洛近似算法讲解(图文解释)
43 0
|
4月前
|
机器学习/深度学习 算法 关系型数据库
【PyTorch深度强化学习】DDPG算法的讲解及实战(超详细 附源码)
【PyTorch深度强化学习】DDPG算法的讲解及实战(超详细 附源码)
578 1
|
4月前
|
机器学习/深度学习 算法
深度强化学习中Double DQN算法(Q-Learning+CNN)的讲解及在Asterix游戏上的实战(超详细 附源码)
深度强化学习中Double DQN算法(Q-Learning+CNN)的讲解及在Asterix游戏上的实战(超详细 附源码)
103 0
|
4月前
|
机器学习/深度学习 算法
深度强化学习中利用N-步TD预测算法在随机漫步应用中实战(超详细 附源码)
深度强化学习中利用N-步TD预测算法在随机漫步应用中实战(超详细 附源码)
34 0