资产管理大佬讲述:如何用大数据及人工智能挑选基金?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

资产管理大佬讲述:如何用大数据及人工智能挑选基金?

以往的市场充满低风险套利机会,比如过去二十年的房地产、过去10年的债券、过去8年的信托、过去7年的理财等等,在这些不复杂的市场环境下,普通投资者不需要投资顾问也很容易赚到钱。然而到了当下,简单套利的时代已经结束,市场环境越来越复杂。那么在这种情况下,用户应该如何进行投资呢?

而与此同时,无论是传统理财行业还是依托数字技术进行的金融科技事业,对基金管理者来说,如何有效识别风险、识别出正确的投资者才是当今理财行为的核心。

日前举行的第三届北外滩对冲基金峰会分论坛“大数据时代的投资管理”上,太平洋另类资产管理公司(PAAMCO)董事总经理 Misha Graboi讲述了人工智能和大数据进行资产管理的一些方法论及原理。

以下是Misha Graboi演讲实录:

我们管理了一些对冲基金,有独立的资产管理。今天我想谈论的主要关于一些新的技术在基金管理当中的应用,它们就是大数据、人工智能。

我不是人工智能的专家,我也无法知道特别多,所以我只是给大家一个概要的介绍,但是我想说——我们是处于一个非常早期的使用人工智能的阶段。很多基金公司也是刚刚开始用人工智能的技术来进行基金选择。我们还没有具体的案例,我们现在只是在初级的阶段,我们希望在未来可以使用这种技术来帮助我们。

大数据和人工智能的关系

所以大数据和人工智能的关系是什么呢?大的数据就是一些数据集,它可以使用,来对于整个机器的学习进行培训。所以我们需要有很大量的数据集。这些数据的规模越大,我们的机器学习的精度就越高。我们也看到机器的学习过程,就是要有现成的一套数据集。

你可能会说,在这样的一个阶段,我们是不是有很多的统计的数据呢?我们是有很多的人工智能,当然在某种形式上是基于统计数据。在金融服务方面我们有很多的模型,实际上它们有两个方面不太好:一是它们不能代表一些关系,比如说有各种各样的线性的关系,有的时候也无法准确阐明数据互相之间的关系;另外一个关系的话几何性的关系,比如一直是平的走,突然之间下降的关系,计算机并不是能特别好的构建这个模型。   

人工智能有很多的好处,其中之一就是它学习能力非常快。我们也看到美国比如说在整个的iPhone销售方面,有很多的数据。这些数据被很多的分析师使用,他们也每天不停地摆弄他们的模型,对数据进行分析,预测未来的市场销售情况怎么样。如果要对那些数据做出即时的反应会比较困难。因为人做是比较慢的,但是人工智能可以做得非常的快。

机器的学习模式

接下来我花几分钟的时间来解释一下,机器是怎么样进行学习的。机器学习的时候它是通过归纳图例来进行学习的,这里面是一些规则的内容,你可以做一个规则来进行预测。

我们是通过归纳推理的方法来进行学习的。比如说,我有一个罐子,我拿出四个球。如果我看到的这四个球,它们都是黑色的,这样我的假设就是这个罐子里面的所有得球可能都是黑色的。我不知道这是正确或者不正确,因为在罐子里面有很多的球。我再拿出6个球,都是黑色的,这样的话我的假设就是所有的球都是黑色的,如果拿得越多,那么我的假设越来越正确。所以我必须对我的假设进行更新。

算法经过不断地调整和改进来得到更好的这种准确性。这就是机器学习的这样的一个过程。它是自己进行编程,自己做验证。每一次错误的时候,这个机器都会做一些调整,所以下一次就会有更好的准确性。

对冲基金为什么要用到人工智能?

这就是人工智能的理论。那么对冲基金如何使用到人工智能?这里我主要是简单介绍一下,主要是涵盖两个方面:

第一个方面是配置方面。我们要做的必须是去打造一个风险分散的组合。对冲基金的话,组合之间的相关性是非常低的,比如说对利率的敏感性是非常低的。这个其实有些时候我们会发现我们必须要思考一下。我们没有办法只看历史,然后来进行这样的配置。我们要知道你所处的市场环境是什么,然后才能打造风险分散的组合。 

另外一方面也看到了人工智能是可以创造价值的,我们要确定你需要什么样的基金策略,来使它在未来的表现会更好。比如说某一些类型的策略,在接下来的6个月、12个月或者24个月它的表现更好,你就可以把这样的策略放在你的组合当中,这样的结果更好。    

还有第三个方面叫做指数的代表性。通常来说我们的客户在进行组合的时候,他们一般都会参考这个回报的指数。但是,这个指数其实有些时候我们并不知道这个经理人他们用的哪个指数,或者是否在这个指数中。我们根本不知道是什么因素驱动着我们的回报。因为这些指数看上去都是不一样的,不同的指数可能会给你带来非常不一样的结果。比如说beta2的话,这些都会给你的结果带来非常多的不同。所以就很难来决定到底是什么样的因素来驱动着这些指数。而问题也是在于你们没有办法完全按照这些指数来进行一个判断,所以很难对你的对冲基金指数进行跟踪。因为你必须要非常清楚地了解这个指数里面的一些东西。

人工智能如何帮助和约束基金经理?

还有一个方面我们也可以创造价值的,就是基金经理的选择,也可以使用人工智能。比如说考虑到基金经理的运气和能力——我们每一个人的成功不仅是基于一个因素,而是两个因素,一个方面是技能,一个是运气。比如过去每年的回报率是6%,这个经理人是否是有运气还是有能力?我们可能会把回报分解为不同的因素,比如说是股权市场的一些情况,股票市场的一些情况。

我们对利率等方面会做一些分解,这些因素是非常复杂的。我们的经理没有办法在这方面给你创造价值。这个过程其实成本非常高,所以你要知道是什么因素驱动你的回报,是基金经理的能力好呢,还是因为他运气好?这是要弄清楚的。

还有一点,就是我们行为的优化。我们在挑选对冲基金的经理的时候,其实我们要考虑到这个经理在未来他的一些行为。在不同的这种形势下的一些行为,所以说什么样的类型的经理交易行为你觉得是可以给你带来好的一个基金表现?这是要考虑到的。过去的话,可能像我有8年的经验了,或者像我们的CEO可能在这个行业已经25年了。所以过去我们只看经验,但是这其实我们的人工智能的这些技术有了的话,我们可以很好地来改进这样的一个基金经理选择的过程。

散户福利:如何应用人工智能做资金配置

接下来我们再来讲一讲如何在我们的资金的配置中来应用人工智能。

一方面是风险的分散,其实我们在寻求的是能够找到一个先行的指标。这些先行指标可以告诉你我们所处的环境的体制是什么样的,通过对市场的了解,我们就可以进行资产的一个配置。比如说历史上的这样的一些相关性其实并不是非常有用,而更好的是使用我们的人工智能,用在我们的界面中,然后就了解到现在的市场的趋势,了解到宏观经济的一些环境,了解到市场的情绪。把所有的这些因素考虑在内,然后更好的了解市场的体制或者结构。并且要意识到,我们可能会看到可能对我们的市场带来很多的风险,这也会对你的组合带来很多风险。

第二个领域就是预测性,我们刚才的话题是使用这个人工智能的一些技术。对于各种数据进行研究,包括宏观经济的数据,以及市场的信息等等。然后计算一下短期和长期的回报是多少。比如说非常简单的一个调查等等,比如说你想买这一家公司,如果你现在市场价39美元,背后的价差是非常少的。当然了,现在这样的一个指标并不是特别的多。你需要考虑在整个金融市场的复杂性,然后提出一个功能强大的模型。然后未来的6到12个月当中,应该怎么样进行配置。

另外一个说到基金经理的选择方面,也是非常类似的。我们需要来了解这个经理的持续性的数字。比如说我有两个经理,他的回报上一年都是8%。上一年他有两个头寸,其中一个是上升了40%,其他的透头寸都是亏损的。另外一个经理人,所有的股票都是上涨了6%。你觉得哪个基金经理人更好呢?有的人可能会说:“我的直觉告诉我第二个基金经理人人更加好,第一个经理可能运气好,所以会获利。”第一个经理说我不了解其他的股票,但是这两个股票我非常了解,所以我可以做得好。使用人工智能的方法,你可以做很多的测试来验证,这样对冲基金经理本身也可以做评估的指标,来了解是不是选择其中的一个经理更好,然后他们是不是有更加持续性的一致性的良好表现。

对于回报方面的驱动因素的分析方面,我认为整个回报数据的结构非常复杂,可以把它分成三个方面。对市场的敏感度,对于利息的敏感度,以及对其他的一些敏感度。实际上整个的驱动因素应该是非常复杂的,它远比这个模型本身所体现的更加复杂。你可以对整个的投资组合做更好的处置,完了要进行定价的决定。比如说你可以用较少的钱买到较多的东西,这样子就能够得到更好的结果。

最后一个部分是行为的优化,你可以了解哪一个投资经理人的行为更具有可预测性。比如说一个经理的话,如果你想买这个股票的话,你可能要买更多的头寸。比如说你下降了3%的话,其他的部分需要做得更好,才能够补回这个损失。还不是非常明确说哪一种方法更好,但是人工智能的话,可以帮助我们来进行分析。可能对于几百个、几千个案例进行分析,如果整个的人工智能系统可以对整个价格的历史做分析的话,你可以得到更精确的一个结果。

使用人工智能的一些风险和问题

最后的话我们想来说一下在使用人工智能时候的一些风险和一些问题。当中有一些人工智能方面的问题,以及金融服务方面的问题。

其实最大的问题就是过渡的拟合。因为人工智能的速度非常的快,对很多的假设可以短时间内进行测试。有的时候它吻合的非常好的一些东西,我们看到做统计的时候,有20个10亿的数据。其中一个在统计学上面是比较好的意义,你对于这个数据进行测试的时候,过渡的拟合反而是不好的。有的时候你可以让你的整个模型变得更加的复杂。

我们看到这个模型当中,如果有30个指标可以来帮助你,是不是会帮助你做更好的预测呢?实际上做到有30个指标做预测,是非常难的。还有一个组合的优化,如果你提高输入数据的规模的话,那么你需要的整个过程也会更加的复杂,这尤其是不好的一个事情。有的时候你可以有非常宝贵的输入的信息的话,它虽然没有增加分析过程的复杂性,因为它的数据的真实性、宝贵性,所以让你能够做很好的判断。有的时候你对于数据集的话,有很多的要求。

还有一个非常有趣的问题。有一些人工智能的模型,有的时候无法去解释。因为这是计算机本身的话运行的一个程序,人类有的时候不了解为什么这个电脑它会做出那样的决定,来执行某一个程序。客户可能会问你发生了什么,你可能说电脑告诉我来买这样的一个股票。他可能会说:“为什么计算机告诉你这么做呢?”你可能告诉他“我不知道”这也是一个问题。你不知道这些问题综合起来考虑,有一个非常具有挑战性的环境。因为你不知道这个计算机是如何决定执行某一个模型的。

还有关于市场方面的一些问题。在市场当中整个的一个机制是会变化的。但是这个人工智能主要是基于历史的数据进行培训,训练出来的。比如说2000年到2007年之间的一些数据来进行验证之后,得出人工智能的能力的话,到2008年的时候,这所有的一切并不是有用的。人也是非常复杂的,市场的机理也会随着时间的推移发生变化。比如说50年以前的历史数据,现在来进行使用的话,当然也不好。你可以尽量地看最近几年的历史数据,但是还是会有一些问题发生的。因为历史的数据总是和现有的数据是不一样的。

人工智能在对冲基金中遇到的挑战

可惜还是会有很多的问题。人工智能用在我们的对冲基金中,还是有一些挑战。

金融服务的领域,有巨量的数据。这些巨大的数据,包括比如说是过去的十年中每一支股票的数据,包括我们运输船运的这些数据。对冲基金在全球来看的话,历史上来说,其实没有太大的透明度,也就是说我们现有的数据是非常是有限的,我们没有办法进行人工智能的一个训练。而前面讲到了人工智能的训练需要基于非常大量的数据集。    

我们现在唯一的数据,也就是我们经理的回忆,或者收益流、回报流这样的一些数据,这是唯一有的一些数据。说过去20年,我们其实很少有对冲基金有这样大量的数据存在。如果假设是20年的话,我们可以有大量的这样一些数据点。但是还有一个问题,你其实并不知道这个经理人做得表现好还是不好。比如说去年我的经理人回报是8%,这个股票市场是10%的回报,您觉得可以吗?很好吗?我不知道,我只知道他给我的回报是8%。如果风险很小,然后8%的回报是很不错的。因为对市场的暴露的风险并不是很大,所以8%是很好了。所以其实我们很多时候是零透明的,这种零透明的情况下,我们并不知道这个结果是好还是不好。这也很难进行人工智能的一个训练。

另外一个层级的话,我们在这个行业,有很多大的基金的配置者是进入到了叫做聚合的透明度,也就是说我们的经理人手上的一些数据,除此之外,还会有其他的一些数据,比如说经理人可以提供的,第三方提供的这样的一些聚合的数据。这个经理人的净资产,或者是投资位置的分配,或者是投资的行业是哪一些,这些数据会稍微好一点。在我们进行管理的经理人的回报,我们对这个股票市场的风险暴露等,还有其他的一些方面,其实我们都是没有很好的透明性。我们可能可以用到手头上的数据序列来做一些分析,来更好的了解这个市场的回报。比如说如果经理人有50%暴露在市场上的话,你可以进行AI的一个训练,告诉他有一半的市场的风险的一个暴露。然后就可以了解到是什么因素在驱动着这个股票市场。所以这会稍微好一点,但是还是会有一些问题存在。

第三个层级我们称之为持仓层面的透明度。对于每一个经理我们会看到每一个人的仓位,这样我们不会只依赖历史数据进行AI的训练,而更多的是会在静态时间点上的仓位进行,这样就会带来非常好的结果,而不是非常短的经理人的历史数据中进行预测。

还有一点其实现在没有人达到这种层面,就是说基本原理的透明性。我们看到每一个经理人都需要打造这样的透明度,就是每一次交易的数据,包括交易日志的透明性。这个经理人必须要解释为什么会有持仓。而通常我们的经理人并没有作出这样的解释。他必须要讲到接下来的12个月,这个公司的绩效会怎么样。我们可以看到这个过程非常的长,我们很难来去判断我们的经理人是真的运气好还是他的技能好。

总结

进一步强调一下,现在整个的人工智能只是在它发展的非常初级的现象。我也知道AI有能力改变对冲基金投资者的策略。未来的5年当中我们需要学习一下如何来进行编程,根据一些逻辑来进行编程。在未来的5到10年当中,你们大家的公司里面可能都会使用一些人工智能的系统来帮助你们进行决策。还有包括运营方面,你可以有更好的一些容易使用的一些策略。如果人工智能能够抓住这样的一些好的决定,那么你就不会在做编程的方块里面,你到其他的方块里面去做。

最后有很多“软”的因素,有的时候这些方面你很难去对于人工智能系统进行培训。比如说这个经理非常好,他的回报率非常高,他的风险非常低。那么我们也可以预测说他是好的,但是他这个人两年之间可能因为内部交易,而被判过刑。这个时候AI没有对这些机动做一个检查。但其实我们一直都会有一些事件是没有办法进行AI训练,我们的AI的训练只能在数据机上面进行训练。目前没有通用的AI,AI只是用在一些特殊的地方。或许有一天我们的AI可以,希望未来真的能够实现。我觉得未来的话,对于我们人类来讲,我们都是处于网络的时代,人还是最终的决策者。


本文作者:温晓桦

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
机器学习/深度学习 数据采集 人工智能
深入探索人工智能与大数据的融合之路
本文旨在探讨人工智能(AI)与大数据技术如何相互促进,共同推动现代科技的进步。通过分析两者结合的必要性、挑战以及未来趋势,为读者提供一个全面的视角,理解这一领域内的最新发展动态及其对行业的影响。文章不仅回顾了历史背景,还展望了未来可能带来的变革,并提出了几点建议以促进更高效的技术整合。
|
8天前
|
机器学习/深度学习 人工智能 分布式计算
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
83 35
|
18天前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
60 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
6天前
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
42 7
|
13天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年12月】
大数据& AI 产品技术月刊【2024年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
1月前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
2月前
|
机器学习/深度学习 人工智能 算法
探索人工智能与大数据的融合之道####
— 本文旨在探讨人工智能(AI)与大数据如何协同工作,以推动技术创新和产业升级。通过分析二者的基本概念、核心技术及应用场景,揭示它们相互促进的内在机制,并展望未来发展趋势。文章指出,AI提供了智能化处理数据的能力,而大数据则为AI提供了海量的训练资源,两者结合将开启无限可能。 ####
|
2月前
|
人工智能 算法 搜索推荐
探索人工智能与大数据的融合之道####
本文深入探讨了人工智能(AI)与大数据之间的紧密联系与相互促进的关系,揭示了二者如何共同推动科技进步与产业升级。在信息爆炸的时代背景下,大数据为AI提供了丰富的学习材料,而AI则赋予了大数据分析前所未有的深度与效率。通过具体案例分析,本文阐述了这一融合技术如何在医疗健康、智慧城市、金融科技等多个领域展现出巨大潜力,并对未来发展趋势进行了展望,强调了持续创新与伦理考量的重要性。 ####
|
2月前
|
数据采集 机器学习/深度学习 人工智能
探索人工智能与大数据的融合之路####
本文将深入探讨人工智能(AI)与大数据之间的共生关系,揭示二者如何相互促进,共同推动技术边界的拓展。不同于传统摘要的概述形式,本部分将以一个生动的比喻开篇:如果把大数据比作广阔无垠的数字海洋,那么人工智能就是航行其间的智能航船,两者相辅相成,缺一不可。随后,简述文章将从数据采集、处理、分析到决策应用的全流程中,详细阐述AI如何借助大数据的力量实现自我迭代与优化,以及大数据如何在AI算法的驱动下释放出前所未有的价值。最后,预告文章还将探讨当前面临的挑战与未来趋势,为读者勾勒一幅AI与大数据融合发展的宏伟蓝图。 ####