专访港科大教授张晓泉:AI目前多做预测分类,还需经济学发现因果关系

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

专访港科大教授张晓泉:AI目前多做预测分类,还需经济学发现因果关系

“人机回圈”(Human in the loop)是人工智能圈的高频词汇。简单地说,就是将个人(专家)或公众群体的判断,融入AI系统的优化中去。这个闭环回路在AlphaGo上展现得淋漓尽致,它之所以能横扫AI和人类对手,与背后包括欧洲围棋冠军樊麾在内的专业棋手团的磋磨分不开。

“在这个过程中,人类其实是在陪机器下棋,机器在逐渐获得人类的知识技能。人类相当于labor,很被动。”

在近期由中国计算机学会(CCF)主办,雷锋网(公众号:雷锋网)和香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会上,张晓泉教授分享了这番观点。

专访港科大教授张晓泉:AI目前多做预测分类,还需经济学发现因果关系

张晓泉现任香港科技大学资讯、商业统计及运营学系教授,此前求学于美国麻省理工学院、清华大学,分别获得管理学博士和管理学硕士学位。他目前的主要研究方向是商业人工智能、互联网金融、信息产品定价策略及大数据营销。学术论文曾发表在《美国经济评论》、《管理科学》等知名学术期刊。目前他还是学术期刊 Information Systems Research(信息系统研究)的高级主编。

人工智能是近年来的明星技术,各行业都纷纷对其敞开怀抱。其中,金融行业对于AI的研究和应用无疑走在前列。作为一位经济学家,张晓泉教授对于人工智能也颇有见地。立足于其研究视角,他指出,经济学有助于优化AI在金融领域的应用。他进一步解释说,

“目前人工智能更多是用于预测和分类,而经济学家的研究重心是找到因果关系,解释清楚事情的底层机制。这也是计算机学家与经济学家看待科技创新的一大差异。”

双方视角之差,犹如地心说与进化论的不同。地心说能够预测太阳明天会升起,但却无法解释背后的原理,因为理论根本是错误的。进化论却相反,它能解释人的由来和进化史,却无法预测人类未来会是什么样。张晓泉教授认为,行业如今的首要目标就是结合两种研究思维,这也是他目前的研究目标。

“除了‘Human in the loop’,我觉得应该也有‘Econ in the loop’。过去20年,经济学家建立了众多数据分析模型,包括整套的计量经济分析框架。若能将这些模型与人工智能相结合,会产生很多有趣的结果。”

Fintech前沿研究

股票情感分析

在股票投资领域,高卖低买一向是投资者的梦寐之求,但绝大多数情况只是黄粱美梦而已。虽然人们无法准确预测股价,但在不断向这个目标靠近。据了解,上世纪70年代,投资领域就开始广泛应用计算机。世界最大的两家资产管理公司黑石与领航都是完全采用量化投资方式。而近年来互联网、移动互联网、云计算、大数据、人工智能等技术的发展,为股票投资带来了更多新可能。

张晓泉教授就有不少围绕股票开展的研究课题。与人工智能相关的一个项目是利用深度学习进行股票情感分析。他的团队利用工具爬虫,全网抓取新闻媒体、散户论坛、微博等文本信息,收集后将其与该公司的金融信息做对比,建立一个模型。

据张晓泉教授介绍,该模型与其他模型的不同之处在于,其他模型从语义分析出发,仅是收集汇总文本含义。而他们的重点是,会进一步获取词汇与股票表现之间的关系,发现每个词在当时起到了什么作用。那么在未来,模型可以进行一些简单预测,发现众人的关注焦点,以及宏观层面的行业轮动。

模糊性研究

高风险、高收益是金融行业的永恒标签,股票投资也与风险息息相关。股票市场的传统风控就是研究股票波动率。业内存在一种观点是,可以用人工智能解决所有的风险管理问题。而张晓泉教授对雷锋网表示,该观点是错误的。

“ 风险有多种层次,而且一旦写出波动率,底层就一定假设了某种概率分布,但是很多时候,我们无法获知金融事件的概率分布。例如股票市场。”

 专访港科大教授张晓泉:AI目前多做预测分类,还需经济学发现因果关系

图1 风险五级别

这里需要先介绍下张教授提出的不确定性的五个级别。

  • 第一层是 Certainty,意味着 100% 会实现。

  • 第二层是 Risk ,即有概率会发生。世界上的大部分问题都处在这个级别,但股票市场就不属于。

  • 第三层是 Black Swan 黑天鹅,也就是小概率事件。

  • 第四层是 Ambiguity 模糊性。“明天的股市不是涨就是跌,但是涨跌的比重没人知道。即便我们有过去世界所有股市的数据,但仍不知道明天是涨还是跌,因为有太多影响因素。”

  • 第五层是 Radical Uncertainty,“ 人们不能描述出 Radica Uncertainty ,也完全无法解决这个级别问题。就好像人无法写一个模型来预测恐怖袭击会在何时、何地、如何发生一样”。

张晓泉教授表示,模糊性是一个比较前沿的研究,结合“Risk”有助于人们加深对风险的理解。举个例子,下图是美国股市从1968年到2016年的波动率,即股票市场的风险“Risk"。

专访港科大教授张晓泉:AI目前多做预测分类,还需经济学发现因果关系

图2 1968—2016年美国股市风险

如果用传统的方法——标准差去描述,看到几个现象:第一风险高点出现在1987年10月19日美国股灾。第二个高峰出现2002年,当时正值互联网泡沫破裂。再往后2007、2008年次贷危机攀上新高峰。

“最近我和同事在做模糊性预测模型,我们发现模糊性最高的是1987年股灾,而2002年科技泡沫时期的模糊性并没有那么高。我们得出的结论是,2002年的互联网泡沫不是一个真正的大泡沫,背后蕴含着技术对于未来的影响力。”

他总结说,经济学的愿景就是希望用模糊性去描述“Risk”没法解决的问题,他们为市场提供了模糊性新指标来衡量股票风险。

从研究到应用,两大跨界趋势

学术研究的目标在于找寻新风景,接下来的产业应用则会偏重于实地探测,挖掘金矿。除了学术经历,张晓泉教授此前也从事过投行分析师、科技公司国际市场部经理等职,还创办过一家互联网企业。他表示,从研究到应用过程中,存在两大跨界趋势。

学术界与产业界交融

第一,学术界和产业界融合愈加紧密。五到十年前,只有科研机构的实验室进行着超前研究,业界相去甚远。AI曾经是一个不被人重视的子领域,Geoffrey Hinton神经网络提出了30多年一直无人问津,但这一切在近五年发生了变化。现在业界的研究已经非常接近科研人员课题,双方互通有无,交流频繁。

此外还出现了顶尖科学家投身产业界的趋势。比如,2013年,人工智能界两位泰斗多伦多大学计算机系教授Geoffrey Hinton、纽约大学终身教授YannLeCun分别加入了Google和Facebook;今年,斯坦福人工智能实验室负责人李飞飞教授兼任谷歌云首席科学家,伦敦大学学院计算机系汪军教授与阿里巴巴合作研发出了多智能双向协作网络等。

“我认为导致变化的主要原因是当时大数据尚未普及,计算能力不够。如今展现了一个非常好的趋势,科学家可能会在公司中任职,或者自己创业,这样能使得一些新的研究成果立刻付诸实践。另外,学术研究人员通常会拥有一种更长远、改变行业规则的心态,这能中和企业短期追求。”

张晓泉教授评价道。

“与此同时,也解决了学术圈长久以来存在的最大问题——资源有限,如数据资源有限,配备设施有限。此外,因为研究发现和实际应用有着一定的距离,落地流程比较繁琐,很多手握专利的教授可能不愿一步一步完成这个过程。而企业的出发点是商业化,只要有利于盈利,它们就会为研究提供资源。这样就形成了良性循环。”

当然,在双方合作落地的过程还存在一些问题,赵晓泉教授指出,其中一大基础矛盾就是学术界和产业界追求存在差异。科学家致力于最前沿的突破,研究如何将准确率95%提升到96%等问题。而企业追求解决问题,产生效用。提升1%,算法速度提升一秒等发现对于他们来说,意义可能并不是那么重大。当绝对值很小的时候,顶尖的研究对于行业的影响较微弱。这要求着学术界、产业界更进一步的沟通理解。

金融与科技的跨界合作

第二个趋势是,金融界与科技界的跨界合作正在接连上演。几乎任何一家金融机构都会设立金融科技部门,很多科技公司也开始涉足金融业务,“Fin”与“Tech”的合流之势不断明朗。

例如,今年六月,国内银行扎堆宣布与科技巨头联姻。当时,张晓泉教授就对雷锋网表达了他的看法,

“公司的存在就是为了提高效率,技术(包括商业大数据、AI)也是为了让工作更有效率,因此这样的合作更早的时候就可以开始了。未来的公司都不需要打标签,没有技术和金融之分,只是用技术来解决各行业的问题。”

与学术界与产业界需增进了解相同,fintech的发展也要求着“银行家”与“工程师”扩大交集。尤其是作为一门应用科学的股票投资。张晓泉教授举例道,一些AI专家写出的预测股票模型在实验室环境下准确率能达到80%,但是由于缺乏对金融市场的理解,真正下场的表现惨不忍睹。他的团队也有做相关预测模型,准确率在75%左右,实际表现也很稳定。

而随着近年来fintech行业的成熟,科技开始触碰到金融真正的核心。一些新技术及产品如雨后春笋涌现,其中以区块链、智能投顾最引人注目。

在张晓泉教授看来,目前智能投顾行业最大的问题是太拥挤了,门槛不高,从业者甚多。

“这个市场发展到最后应该是一家独大。现在的智能投顾仍处于跑马圈地阶段,类似于早期互联网时代出现了数不胜数的搜索引擎。当时没人知道哪家会赢,现在也是如此。”

至于区块链,他表达了对其前景的看好。虽然如今还处于早期阶段,业界还在解决一些最基本的技术问题。同时,他也指出,区块链最大的挑战在于没有形成一个很好的商业模式。技术人才缺乏商业认知,有商业背景的人缺乏对于技术的深刻理解。

随着新技术的发展渗透,难免会对行业以及整个社会造成冲击。其中,面对AI对于金融行业的影响,监管是个始终绕不过去的话题。张晓泉教授在最后也谈到了这方面的观点。

“新技术及相关产业的发展犹如大浪淘沙,在推动行业从业者尝试,磨合出商业模式的同时,还会对传统社会的理念、机制造成改变,比如法律法规。过去的土地所有制在飞机出现后就不再适用,不然每一次飞行都侵犯了所有者的权利。这说明,当技术导致大环境变化时,法律法规需要进行进行调整。”


本文作者:伊莉


本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
机器学习/深度学习 人工智能 数据挖掘
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
|
1天前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第16天】北京大学张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可使攻击者通过特定数据样本误导AI诊断,引发误诊风险。此发现引起广泛关注,强调了医疗AI安全评估的重要性。
8 4
|
2月前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之说话人识别的两种类型分类如何解决
通义语音AI技术问题之说话人识别的两种类型分类如何解决
55 5
|
5月前
|
机器学习/深度学习 数据采集 人工智能
【AI 场景】设计一个 AI 系统来识别和分类图像中的对象
【5月更文挑战第3天】【AI 场景】设计一个 AI 系统来识别和分类图像中的对象
|
5月前
|
人工智能 算法 数据处理
App Inventor 2 Personal Image Classifier (PIC) 拓展:自行训练AI图像识别模型,开发图像识别分类App
这里仅仅介绍一下AI图像识别App的实现原理,AI的基础技术细节不在本文讨论范围。通过拓展即可开发出一款完全自行训练AI模型,用于特定识别场景的App了。
143 1
|
5月前
|
机器学习/深度学习 人工智能 Cloud Native
助力 AI 技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”
技术开源是蚂蚁集团的重要技术战略,我们希望通过开源建立起开放、包容的技术生态,让更多人共享技术红利。
助力 AI 技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”
|
10月前
|
机器学习/深度学习 传感器 人工智能
在AI Earth农作物种植有没有对应的模型呢?例如:知道某个地块的坐标,可以获取农作物的分类、苗情、长势、成熟度、估产、农闲田、灾害、土壤墒情等这方面?
在AI Earth农作物种植有没有对应的模型呢?例如:知道某个地块的坐标,可以获取农作物的分类、苗情、长势、成熟度、估产、农闲田、灾害、土壤墒情等这方面?
74 1
|
人工智能
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
101 0
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
|
机器学习/深度学习 人工智能 并行计算
WAIC 2023 | 新加坡国立大学尤洋教授 :AI大模型的挑战与系统优化(1)
WAIC 2023 | 新加坡国立大学尤洋教授 :AI大模型的挑战与系统优化
142 0