机器废渣!AI离占领华尔街还早着呢

简介:
本文来自AI新媒体量子位(QbitAI)

再怎么炒,把AI用到投资上问题依然很大。

十年前,在自动投资算法突然失控,导致数十亿美金损失和高盛旗舰量化基金的最终关闭后,人们一度拔掉了计算机的插头。

如今,十年过去,人工智能和机器学习成了自动化投资领域最热门的词汇。但在那些铺天盖地的宣传之下,将AI用在投资上依然存在着三个严重的问题:运行得太“好”,难以理解,以及只知道最近的历史。更糟糕的是,随着各种不同的算法在市场上刚正面,这类工具的流行其实是在自掘坟墓。

现在的机器学习系统非常擅长发现模式。但过犹不及,计算机常常运转过度,以至于发现一些并不存在的模式。

安盛罗森堡股票的首席策略师Michael Kollo指出,一个由三名华盛顿大学研究者开发的神经网络,在分辨狼和狗的图片时其实是将狼和雪联系在一起。

“它能轻易地辨认出某些‘不妥协’的性质,并将其作为一条规则来学习。”Kollo说。如果用过去35年的市场状况对一个AI进行训练,它可能只会得出一条简单的规则:买债券。

1982年7月,当时国债的债息是13.7%;而本周一,这个数字是2.31%——从事后诸葛亮的角度看,AI的想法非常不错。然而,未来35年里债息绝不可能再下降这么多了。

在业内,识别出某些不会重复的模式被称作“过度拟合”,比如在图片中的雪与狼之间建立相关性,或者用在过去股市中发现的模式去冒未来的险。

温顿集团对冲基金的创始人David Harding说,寻求某些方式,来避免用上这些假模式是计算机驱动投资的核心。

“避免过度拟合是一种心态。”他说,“这跟避免那些一厢情愿的事情是一回事。”

 在度过了经济危机后,计算机驱动的对冲基金表现非常好,并且正在吸引越来越多新的投资。

Man AHL量化基金的首席科学家Anthony Ledford说,更高级的机器学习系统有时会更没用。“你用的模型越复杂,它对你用于训练的那些数据解释得就越好,但它解释未来数据的能力就不那么好。“他说。一个模型需要接受这样的事实,即市场上大部分的东西都是无意义的,同时模型需要去收纳更广阔的信号,即便它会落下某些过去数据的波动。

许多量化投资者坚持,他们所采纳的任何规则,其背后必须存在一条经济或行为学上的一条基本原理,以此来避免过度拟合。如果计算机发现每月的第三个周三堪萨斯下雨时,在巴黎登记的石油公司股价都会上涨,在未来以此为依据进行投资无异于“信仰之跃”。

不幸的是,要解释系统做出某种决定的原因是不可能的。美国的国防研究机构正在资助团队试图解决的,也正是这一问题。

透明度的缺失意味着绝大部分先进的系统只能处于试运行的状态,投入的资金很少,同时需要人类的意见进行辅助。

Charles Ellis就是典型的案例。他在11月加入都柏林的Mediolanum资产管理公司,负责开发机器学习系统,为各个部门提供建议。这套系统用了与美国股市相关的1500个变量上20年的数据进行训练,并用随机森林回归模型来避免过度拟合。

据Ellis的说法,初期的结果不错。但它只被用于200亿美元资金投资组合中的一小部分,而且最终的决定依然由基金经理完成。另一种为预测经济周期而设计的系统目前也被看好。

随机森林方法的弊端是很难理解计算机为何会做出特定决策。

“这是个黑箱。你不知道它为何会产生这种效果。”他说。

Kollo说,如果难以被理解,那么在赔钱的情况下,恐怕只能将那个系统关闭。

“所有东西走到最后都不对,每个算法都有倒霉的那天。”他说,“存活与否,其实就在于它们能否解释自己干的那些事情。”

一些投资者不在乎透明度的缺失。Jeffrey Tarrant的Protégé Partners公司投资对冲基金,他说“这对我来讲根本没什么”。他投资了六支使用AI方法的基金,都是典型地使用了不寻常的数据来源,同时有着非标准背景的基金经理。他估计至少有75家基金声称自己用了AI,但他觉得也就25家是真的。

长期使用计算机管理资产的投资者对最近的AI风潮不以为意。

“因为告诉别人你可以用电脑来管钱,自己已经像被对待白痴一样对待了三十年,然后现在那些人走过来又告诉我说,你可以用电脑来管钱。”Harding说。

他用于期货价格移动平均值的机器学习应用已经帮他成为了一名亿万富翁。他的团队只是把机器学习当作另外一种用来发现市场异常现象的统计学技术而已。

二十年前,当负责系统的带头大哥投资对冲基金Tudor时,Sushil Wadhwani曾经使用过机器学习。而如今,他正运营着自己的机器学习自动化基金——只不过时不时要把系统重写一遍。2008年,在几年的经验证明欧元区最好和最烂债券之间的价差不依赖于基本经济要素后,他不再做欧洲的债券分析。随着银行系统的内爆,他知道这种东西已经没用了。

“对于机器而言要学会那些东西非常困难,除非它知道自己应该去看上世纪30年代的东西。”他说。

高频系统可能已经吃下了足够多交易制度变化的案例,但仍然不能部署太多的资本。当使用的新数据集只回溯到过去十年、二十年时,要把机器学习用在长期投资上其实非常难搞。没有历史知识的计算机注定要重蹈覆辙。

【完】

本文作者:吴唯
原文发布时间:2017-07-18
相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI与艺术创作:机器的艺术天赋
【10月更文挑战第31天】本文探讨了AI在艺术创作中的应用及其独特“艺术天赋”。从绘画、音乐、文学到设计,AI通过计算机视觉、自然语言处理和生成对抗网络等技术,逐渐展现出强大的创作能力。尽管面临原创性、审美标准和法律伦理等挑战,AI艺术创作仍为艺术界带来了新的视角和灵感,未来有望与人类艺术家共同推动艺术的创新与发展。
|
3月前
|
机器学习/深度学习 人工智能 算法
AI伦理边界:当机器决策超越人类认知
【9月更文挑战第5天】AI伦理边界的探索是一个复杂而艰巨的任务,需要政府、企业、学术界和社会各界的共同努力。随着AI技术的不断发展,我们有理由相信,通过不断的探索和实践,我们一定能够找到一条既符合伦理道德又能够充分发挥AI技术潜力的道路。在未来的日子里,让我们携手并进,共同迎接AI技术带来的机遇与挑战。
|
5月前
|
机器学习/深度学习 人工智能 算法
AI与创意写作:机器如何学习讲故事
【7月更文挑战第8天】在数字时代的浪潮中,人工智能已经从实验室走向了文学创作的领域。本文将探讨AI在创意写作中的应用,揭示它如何通过算法模仿人类的思维模式,生成引人入胜的故事。我们将一同穿梭于代码与文字之间,见证一个由数据驱动的叙事新纪元的诞生。
|
5月前
|
机器学习/深度学习 人工智能 数据可视化
东哥教你如何用Orange Ai pro为家里做一个垃圾分类检测机器
## 摘要 本文由东哥原创,介绍了使用Orange AI Pro开发板进行AI项目开发的体验。这款开发板主打强大的AI算力,搭载昇腾AI芯片,提供8-12TOPS的性能,媲美英伟达RTX3080显卡。它支持外接eMMC和4K显示器,适合实时视频流模型部署。作者详细阐述了从购买、烧录镜像到环境配置的过程,包括安装ACLLite库、模型转换工具ATC的使用,以及YOLOv5模型的转换和部署。文章还展示了如何建立一个垃圾检测项目,利用计算机视觉进行实时垃圾分类,并分享了性能体验,认为开发板在散热和噪音控制上表现良好,适合AI爱好者和开发者进行DIY项目。
|
7月前
|
人工智能
AI信任危机之后,揭秘预训练如何塑造机器的可信灵魂
【5月更文挑战第10天】研究人员探讨了预训练如何影响大型语言模型的可信度,以解决AI信任危机。论文通过线性探测和相互信息估计分析预训练过程中的可信度变化,发现模型在预训练早期就能区分可信度概念。提出使用引导向量增强预训练阶段的可信度,但该方法仍需进一步研究验证。研究表明预训练有“拟合和压缩”两阶段,为理解模型可信度提供新视角。[论文链接](https://arxiv.org/abs/2402.19465)
60 3
|
机器学习/深度学习 人工智能 算法
专栏介绍《机器智造:AI与实战学习》
专栏介绍《机器智造:AI与实战学习》
63 0
|
存储 机器学习/深度学习 人工智能
LangChain + Streamlit + Llama:将对话式AI引入本地机器
在过去的几个月里,大型语言模型(LLM)获得了极大的关注,引起了全球开发人员的兴趣。这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员而言。LLM带来的可能性引发了开发人员的热情 |人工智能 |NLP社区。
623 0
|
机器学习/深度学习 人工智能 自然语言处理
像GPT-4一样能看懂图文,李飞飞等人的具身AI给机器人造了个多模态对话框
像GPT-4一样能看懂图文,李飞飞等人的具身AI给机器人造了个多模态对话框
206 0
|
数据采集 机器学习/深度学习 人工智能
AI机器狗情绪识别
机器如何识别人的情绪
240 3
|
机器学习/深度学习 人工智能 自然语言处理
AI再卷数学界,DSP新方法将机器证明成功率提高一倍
AI再卷数学界,DSP新方法将机器证明成功率提高一倍
195 0