去年开始涉足人工智能技术应用于证券投资领域的研究,将近两年的研究实践,发现公开资料上很多关于人工智能(AI)对证券投资业发展影响的文章都存在几个明显的思维误区:①一个是对人工智能的认识有误。人工智能是个广域笼统的概念,但基石是机器学习,以机器学习算法构建逻辑和规则为基石的人工智能与自动化程序软件及通过数据回测构建起来的以固定逻辑运行的量化投资模型是完全不同的事物,区别就好比活鸡和模型鸡,需要明白自动化软件不是人工智能,国内大多数所谓智能投顾其实还不是真正意义上的人工智能投顾;②另一个是曲解了人工智能在证券投资行业的应用。简单地理解为通过采样数据及数据处理寻找特定的因果联系,进而“预测”(基于概率统计推导)标的物价格涨跌及给出“最优”(基于某种量化指标的数据值)的投资建议。这本质上还是自动化程序软件干的事,和人工智能机器学习算法扯不上多大的关系;③再一个是将人工智能无限神化。认为人工智能在证券投资行业所到之处必摧枯拉朽所向披靡,产生绝对的高维度碾压低维度的优势。证券投资是一项多层次结构的系统工程,能够决定投资成败的不是单一因素而是全局架构,人工智能只能尽可能多的在某些领域和环节发挥一些人无法企及的超常规作用,但是也有很多领域和环节是其无法涉足的,人有发散性思维的能力,而机器的思维始终都是线性的。人工智能本质上还是工具,还是被人驭着耕田的牛,人工智能在证券投资行业发挥多大作用核心还是看人的思维,人把它用在哪里以及怎么用。你骑着耕牛去插秧,不光你尴尬,牛也挺尴尬。④最后一个是认为人工智能实战应用于证券投资行业还很遥远。这个世界永远有人起得比你早,永远有人睡得比你晚,就好比N年前期货市场量化交易一样,当你还在努力弄明白什么是量化投资的时候,起得早的人早已经在量化投资领域功勋卓著了。在我们能力所及的认知觉范畴,人工智能实战应用于证券投资领域已经不少于10年了,国内最早一批成功应用人工智能技术辅助证券投资的机构,基本是和云计算同步出现的,其绩效也不是传统的量化交易模式可以比拟的,这个市场有很多“暗网”性质的应用现代投资工具的技术团队,你很难在公开的资料中查到他们的相关信息,但绩效却十分惊人。还是上面提到的,人工智能在证券投资领域的全局应用暂时还实现不了,因为证券投资是个多层次结构的系统工程,和围棋这种双方博易的事物不同,形象地讲,人工智能在证券投资领域以完整机器人形态出现还不现实,目前还是以机械假肢、机械外骨骼、心脏起搏器、助听器等辅助形式存在,即便是这种局部环节的作用存在,对这个行业产生的影响都是十分巨大的。 我们过去两年的研究一直停留在理论研究和算法构建的层面,正真走向台前,理论落地也是在最几个月,尤其是阿里云支持非结构数据计算的“数加·MaxCompute”9月香港市场上市开服,才让真正意义上的低成本超级计算成为现实,以前民营技术公司想要低成本应用超级计算门都没有, MaxCompute(原ODPS,https://www.aliyun.com/product/odps)不光提供计算力,还提供通用的人工智能算法,还提供了如“CPU+GPU”,“CPU+FPGA”等异构运算模式,能够更适合深度学习、金融分析等计算密集型领域,比传统CPU并行计算更高效,能用1小时的时间解决传统CPU运算几十天才能解决的问题,还简单易用,你只要有数据和想要利用这些数据实现的目标就行了,最可恨的是成本极低没有门槛,只要有足够天赋,6岁小孩都可以成为人工智能的大神。马云有酒还有开瓶器和杯子,你有故事就来!正真应了那句话,未来是我们的,也是你们的,但归根结底是那些活得久活的好的人的,而那些人的世界最终还是马云爸爸创造的。
正是因为看到了人工智能三个核心要素——数据+算法+计算力在当下的中国都已经不是问题,我们才惊恐地意识到人工智能产业大爆发会比我们想象中的要来的更早,才真正明白了百度李彦宏的人工智能战略以及2017年作为人工智能爆发年的原因。我们也看到了金融领域技术创新的严重滞后,强烈利益导向的证券投资行业将不可避免地迎来真正的“野蛮人”,不管你信不信,骑着人工智能这头疯牛的“野蛮人”会再造我们这个市场的生态,可能还容不得你仔细思考,量化时代就一步迈进人工智能时代了。
关于人工智能,有一个经典的机器学习算法认识猫的的案例。你不用告诉机器学习算法什么是猫,算法也不会问你猫的定义,你只需要给它大量的100%是猫与100%非猫的各种形式的数据,算法依据一些既定的规则在这些数据中构建逻辑。当算法接触到第10组数据训练的时候,它可能会把一片草地定义为猫,因为它在前十组数据中发现了草地是显著的共性特征,当机器学习算法接触到第100组数据训练的时候,它可能会把骆驼定义为猫,因为它排除了草地是猫的可能但区分不了同样是四条腿,骆驼和猫有什么不同,当接触到第10000组数据训练的时候,它能依托之前数据训练中构建起来的逻辑对不同品种不同姿态的猫精准识别,当接触到第1000000组数据的时候,它将一种貌似兔子实则为猫的动物准确地定义为猫,而你却只能凭着经验和主观将它定义为兔子,当算法接触到第1000000000组数据训练的时候,它准确且毫不犹豫地将一只诞生在火星上的基因再造猫排除在了猫定义的范畴之外,因为他的逻辑中形成了一种人类无法理解的哲学和伦理,在外星球诞生,没有历经几十亿年漫长生物进化的这种生命,到底还是不是我们所定义的猫?这个问题足够人类争论100年而莫衷一是的了。从某种意义上讲,可能以机器学习算法为基石的人工智能对这个世界的认识才是更加真实的。
把证券投资领域AI机器学习算法所要处理的问题限定在一个有限的空间,在简单的初设目标下通过海量数据来训练算法,类似于阿尔法狗围棋博弈算法的运作模式,一个行之有效的动态交易规则算法是非常有可能被创造出来的。中国有一个特点是人多,证券市场交易数据量比较大,即便是现代意义上的证券市场产生发展也才不到30年的时间,但是我们的交易数据一点都不比美国这种成熟的证券市场少,在AI所应用的金融领域,中国跟美国是可以站在同一条起跑线上的。
你不用告诉机器学习算法怎么赚钱,算法也不会问你怎么赚钱,你只需要给它大量的相同交易规则但不同标的的三维(价格、时间、成交量)交易数据(取样自真实股票市场环境),算法第一步是给这些数据标注赚钱交易和非赚钱交易的标签,第二步是依据一些既定的规则在这些数据中基于特定目标构建逻辑,比如:我们给算法的既定规则是:一笔交易由进场和>=T+1离场两个动作完成,正价差定义为盈利,0价差及负价差定义为非盈利,盈利只有流动性边际没有膨胀边际,非盈利有塔缩边际;定义有效价格及时间内进场、离场为一个策略的基本平面要素,平面要素基础上增加标的组合(资金分配)要素构成立体模型,定义模型的三个指标要素——成功率、盈亏比、周转率,三者在固定交易成本及交易可有效执行的条件下可以动态匹配,让算法在大量的交易数据中强化盈利训练生成机器学习逻辑,第二阶段让算法抛开交易数据,在连续的行情数据中依托之前形成的盈利逻辑自主进行在初始资金塔缩边际和流动性条件约束下(风险控制前置+交易可执行)以绩效为目标的动态反馈的盈利交易规则构建及优化,这里已经比较类似于围棋的博弈了。用各种定义和规则使证券投资这种多层次多维度发散性的广域问题龟缩到了一个收敛性的可以用人工智能机器学习算法有效应对的范畴,也就是说不再让人工智能告诉你如何成佛这种发散性问题,而只是告诉你每一个当下念哪一句经不会成不了佛。
我们用这种机器学习算法构建了多个智能交易规则,随着交易数据的不断扩充,这些智能交易规则会愈加强悍。实际应用中,我们将运算服务器生成的规则数据导入到传统报价软件的界面形成可视化模型,最后惊奇地发现,算法给出的高绩效交易规则模型居然无一例外全是强势短线模式(也可能是小周期交易数据充分的原因导致的),从而侧面证实了市面上一些主观交易的成熟模式。我们在公众微信平台演示公测了部分模型并持续跟踪其绩效,如PATH*AI模型,你会发现,之前你对交易的理解和认识很多时候都是肤浅的,就好比机器学习算法可能更理解猫一样,机器学习算法可能也更懂交易,在智能算法面前,我们不得不承认自己对交易认识的局限性和不足。