机器废渣!AI离占领华尔街还早着呢

简介:
本文来自AI新媒体量子位(QbitAI)

再怎么炒,把AI用到投资上问题依然很大。

十年前,在自动投资算法突然失控,导致数十亿美金损失和高盛旗舰量化基金的最终关闭后,人们一度拔掉了计算机的插头。

如今,十年过去,人工智能和机器学习成了自动化投资领域最热门的词汇。但在那些铺天盖地的宣传之下,将AI用在投资上依然存在着三个严重的问题:运行得太“好”,难以理解,以及只知道最近的历史。更糟糕的是,随着各种不同的算法在市场上刚正面,这类工具的流行其实是在自掘坟墓。

现在的机器学习系统非常擅长发现模式。但过犹不及,计算机常常运转过度,以至于发现一些并不存在的模式。

安盛罗森堡股票的首席策略师Michael Kollo指出,一个由三名华盛顿大学研究者开发的神经网络,在分辨狼和狗的图片时其实是将狼和雪联系在一起。

“它能轻易地辨认出某些‘不妥协’的性质,并将其作为一条规则来学习。”Kollo说。如果用过去35年的市场状况对一个AI进行训练,它可能只会得出一条简单的规则:买债券。

1982年7月,当时国债的债息是13.7%;而本周一,这个数字是2.31%——从事后诸葛亮的角度看,AI的想法非常不错。然而,未来35年里债息绝不可能再下降这么多了。

在业内,识别出某些不会重复的模式被称作“过度拟合”,比如在图片中的雪与狼之间建立相关性,或者用在过去股市中发现的模式去冒未来的险。

温顿集团对冲基金的创始人David Harding说,寻求某些方式,来避免用上这些假模式是计算机驱动投资的核心。

“避免过度拟合是一种心态。”他说,“这跟避免那些一厢情愿的事情是一回事。”640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

 在度过了经济危机后,计算机驱动的对冲基金表现非常好,并且正在吸引越来越多新的投资。

Man AHL量化基金的首席科学家Anthony Ledford说,更高级的机器学习系统有时会更没用。“你用的模型越复杂,它对你用于训练的那些数据解释得就越好,但它解释未来数据的能力就不那么好。“他说。一个模型需要接受这样的事实,即市场上大部分的东西都是无意义的,同时模型需要去收纳更广阔的信号,即便它会落下某些过去数据的波动。

许多量化投资者坚持,他们所采纳的任何规则,其背后必须存在一条经济或行为学上的一条基本原理,以此来避免过度拟合。如果计算机发现每月的第三个周三堪萨斯下雨时,在巴黎登记的石油公司股价都会上涨,在未来以此为依据进行投资无异于“信仰之跃”。

不幸的是,要解释系统做出某种决定的原因是不可能的。美国的国防研究机构正在资助团队试图解决的,也正是这一问题。

透明度的缺失意味着绝大部分先进的系统只能处于试运行的状态,投入的资金很少,同时需要人类的意见进行辅助。

Charles Ellis就是典型的案例。他在11月加入都柏林的Mediolanum资产管理公司,负责开发机器学习系统,为各个部门提供建议。这套系统用了与美国股市相关的1500个变量上20年的数据进行训练,并用随机森林回归模型来避免过度拟合。

据Ellis的说法,初期的结果不错。但它只被用于200亿美元资金投资组合中的一小部分,而且最终的决定依然由基金经理完成。另一种为预测经济周期而设计的系统目前也被看好。

随机森林方法的弊端是很难理解计算机为何会做出特定决策。

“这是个黑箱。你不知道它为何会产生这种效果。”他说。

Kollo说,如果难以被理解,那么在赔钱的情况下,恐怕只能将那个系统关闭。

“所有东西走到最后都不对,每个算法都有倒霉的那天。”他说,“存活与否,其实就在于它们能否解释自己干的那些事情。”

一些投资者不在乎透明度的缺失。Jeffrey Tarrant的Protégé Partners公司投资对冲基金,他说“这对我来讲根本没什么”。他投资了六支使用AI方法的基金,都是典型地使用了不寻常的数据来源,同时有着非标准背景的基金经理。他估计至少有75家基金声称自己用了AI,但他觉得也就25家是真的。

长期使用计算机管理资产的投资者对最近的AI风潮不以为意。

“因为告诉别人你可以用电脑来管钱,自己已经像被对待白痴一样对待了三十年,然后现在那些人走过来又告诉我说,你可以用电脑来管钱。”Harding说。

他用于期货价格移动平均值的机器学习应用已经帮他成为了一名亿万富翁。他的团队只是把机器学习当作另外一种用来发现市场异常现象的统计学技术而已。

二十年前,当负责系统的带头大哥投资对冲基金Tudor时,Sushil Wadhwani曾经使用过机器学习。而如今,他正运营着自己的机器学习自动化基金——只不过时不时要把系统重写一遍。2008年,在几年的经验证明欧元区最好和最烂债券之间的价差不依赖于基本经济要素后,他不再做欧洲的债券分析。随着银行系统的内爆,他知道这种东西已经没用了。

“对于机器而言要学会那些东西非常困难,除非它知道自己应该去看上世纪30年代的东西。”他说。

高频系统可能已经吃下了足够多交易制度变化的案例,但仍然不能部署太多的资本。当使用的新数据集只回溯到过去十年、二十年时,要把机器学习用在长期投资上其实非常难搞。没有历史知识的计算机注定要重蹈覆辙。

【完】

本文作者:吴唯
原文发布时间:2017-07-18
相关文章
|
6月前
|
机器学习/深度学习 人工智能 算法
专栏介绍《机器智造:AI与实战学习》
专栏介绍《机器智造:AI与实战学习》
37 0
|
8月前
|
存储 机器学习/深度学习 人工智能
LangChain + Streamlit + Llama:将对话式AI引入本地机器
在过去的几个月里,大型语言模型(LLM)获得了极大的关注,引起了全球开发人员的兴趣。这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员而言。LLM带来的可能性引发了开发人员的热情 |人工智能 |NLP社区。
451 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
像GPT-4一样能看懂图文,李飞飞等人的具身AI给机器人造了个多模态对话框
像GPT-4一样能看懂图文,李飞飞等人的具身AI给机器人造了个多模态对话框
111 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI再卷数学界,DSP新方法将机器证明成功率提高一倍
AI再卷数学界,DSP新方法将机器证明成功率提高一倍
132 0
|
机器学习/深度学习 人工智能 自然语言处理
机器之心开放人工智能专业词汇集(附Github地址)
作为最早关注人工智能技术的媒体,机器之心在编译国外技术博客、论文、专家观点等内容上已经积累了超过两年多的经验。
517 0
机器之心开放人工智能专业词汇集(附Github地址)
|
人工智能 开发者
院士、百万博主、机器汪精彩纷呈|昇腾 AI 开发者创享日全国巡展南京站成功举办!
院士、百万博主、机器汪精彩纷呈|昇腾 AI 开发者创享日全国巡展南京站成功举办!
院士、百万博主、机器汪精彩纷呈|昇腾 AI 开发者创享日全国巡展南京站成功举办!
|
传感器 人工智能 机器人
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—15:30-16:10孙富春教授《机器人视触觉传感器与主动感知》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—15:30-16:10孙富春教授《机器人视触觉传感器与主动感知》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—15:30-16:10孙富春教授《机器人视触觉传感器与主动感知》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:10-14:50王亮教授《面向复杂视觉任务的视觉认知计算》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:10-14:50王亮教授《面向复杂视觉任务的视觉认知计算》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:10-14:50王亮教授《面向复杂视觉任务的视觉认知计算》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—13:30-14:10山世光教授《从看脸到读心:基于视觉的情感感知技术》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—13:30-14:10山世光教授《从看脸到读心:基于视觉的情感感知技术》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—13:30-14:10山世光教授《从看脸到读心:基于视觉的情感感知技术》