带你读《金融科技:人工智能与机器学习卷》之一:金融变革新时代

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本书从人工智能和机器学习面向金融客户端的应用、面向运营环节的应用、在交易和投资管理中的应用以及面向监管合规的应用四个方面进行梳理,从理论和实践角度分析目前人工智能技术在金融业各个部门和各个环节的应用场景,并分析了具体的应用案例。本书整体上呈现了从宏观到微观,再从微观到宏观的逻辑架构,既适合金融机构和从业人员、相关政府机构人员和金融监管者阅读,也适合对金融、科技以及金融科技感兴趣的学者、学生和其他各界人士阅读。

点击查看第二章
点击查看第三章
金融科技:人工智能与机器学习卷

image.png

刘 斌 赵云德 著

第1章

金融变革新时代

从原子到比特:金融契约的演变

在人类漫长的演变过程中,金融的出现对人类文明的发展和整个社会的进步起到了至关重要的作用。可以毫不夸张地说,整个人类文明史就是一部金融史,人类最早的文字就是为了记录人们的金融交易而发明的,人类最早的写作行为就是古代西亚地区的人们为了记录金融契约而发明的,人类社会第一个有关时间和风险的复杂模型也和金融紧密相关。
在人类历史上的金融变迁过程中,最关键的是记录各种交易信息的金融契约形式和内容的演变历程。这些金融契约的作用就是把交易相关的协议或合约记录下来。人类历史上记录金融契约的载体包括陶片、有刻痕的木棍和木块、密封的羊皮纸、印制的纸张,以及今天的电子文档。目前已知的人类历史上最早的金融契约是出现在距今3000多年前的美索不达米亚的贷款合约,这些贷款合约登记了借款人的姓名,以及他们所欠大麦的数量,如图1-1所示。

image.png

后来,在伊拉克发现的布拉(bulla,陶土球)记录了公元前8世纪的农业交易,如图1-2所示。这种布拉是一种空心陶土球,在布拉表面,合同各方可以写下金融契约的责权细节—包括支付金额、时间等。布拉的内侧则刻有代表交易的符记。陶土球外侧的文字和内侧的符记彼此相互验证。
中国古代最早用青铜器来记录交易活动。1975年宝鸡市发现了一处周代的青铜器窖藏,其中的卫盉是周恭王时期铸造的盛酒器,该器盖内有铭文132个字,记述了裘卫与贵族矩伯进行土地交换的全过程,如图1-3所示。因为交换涉及土地转让,裘卫将此事向伯邑父、崇伯、定伯等执政大臣报告,由三有司(司徒、司马、司空)出息公证,主持田地移交仪式。裘卫为了将此事告诉其已经逝世的父亲,便制作了这个青铜器,祈求上苍和先祖保佑子孙能万年永远享用。
在中国古代则用竹片、木简片来记载金融交易活动。《战国策·齐策》中记载战国时期孟尝君担任齐国相国时,问门下诸客:“谁习计会,能为文收责于薛者乎?” 冯谖署曰:“能!”孟尝君怪之,曰:“此谁也?”左右曰:“乃歌夫长铗归来者也。”孟尝君笑曰:“客果有能也,吾负之,未尝见也。”请而见之,谢曰:“文倦于事,愦于忧,而性懧愚,沉于国家之事,开罪于先生。先生不羞,乃有意欲为收责于薛乎?”冯谖曰:“愿之。”于是,约车治装,载券契而行。大意是孟尝君问门下门客谁能去薛地收债,其中一个叫冯谖的门客答应前往,并载券契而行,此处的券契就是当时记录借贷活动的金融契约,主要记录在竹片或木简片上,上面记载有放债的款项、利率,以及债权债务人双方的签字等。

image.png

image.png

中国历史上发明的造纸术则推动了金融契约的革命性进步,此后纸张成为记录金融交易契约的主要载体并流传于世。在我国新疆地区发现的魏晋至唐后期的契约中,我们可以看到很多古代以纸张为载体的金融契约。此外在甘肃敦煌也发现了大量唐宋时期的契约,1960年出版的《敦煌资料》第一辑主要就是关于契约,共120余件,分为买卖、典租、雇佣、借贷和其他契约、文书5个部分。金融契约向纸质载体演变以后,金融契约的类型、内容和形式都得到了极大的丰富,在金融的发展演变过程中发挥了重要作用。
1946年,世界上第一台电子数字式计算机在美国宾夕法尼亚大学正式投入运行,这台计算机的名字叫ENIAC,如图1-4所示。电子计算机的出现代表着人类正式从工业时代进入信息时代,相应地人类记录金融交易活动的各种金融契约也从原子时代进入比特时代。此后计算机的出现带来的互联网发展浪潮彻底改变了人们生活的各个方面,尤其是金融,人类第一台计算机改进后的最早使用者是保诚保险公司,1948年美国银行开始使用IBM604型计算机。这一切还只是开始,当金融契约进入比特时代之后,金融业面临的巨大变革才刚刚拉开序幕。

image.png

引爆点来临:互联网引发金融数字化

计算机的发明是人类历史上的又一次飞跃,计算机在人类历史上的地位绝不亚于文字、货币、蒸汽机等这些重大发明,计算机应用的普及以及和现代通信技术的结合,推动了互联网技术的发展和移动互联网应用的普及,互联网向各个传统行业的渗透和普及真正带领人类进入了数字时代。
在数字时代,人们生活的各个方面都可以在互联网上留下足迹,由此产生了大量的数据。IBM研究显示,目前人类每天产生的数据已经达到大约2.5艾(quintillion,10的18次方)字节,这意味着实际上90%的数据是在过去两年产生的。截至2017年6月,全球移动用户数达到77.2亿,手机超越电脑成为第一大上网终端。移动互联网发展推动脸书、推特、微信等社交媒体快速扩张,截至2017年6月,全球社交媒体活跃用户总数约为30.28亿,移动端活跃用户约为27.8亿。据IDC预测,2025年全球数据量将达到163ZB,比2016年创造出的数据量增加10倍;全球每天每个人与联网设备互动的次数近4800次,平均每18秒产生一次互动;全球数据的数据分析总量将增至5.2ZB,是原来的50倍。人类产生的数据量正以不可思议的速度增长,物联网、自动驾驶汽车、社交媒体、智能家居设备、可穿戴设备等将产生大量有价值的数据,这些数据将成为未来人类社会的重要基础资产。
中国互联网经济的发展在过去二十年取得了非常明显的成就。一方面,网民数量规模位居全球首位,截至2017年12月,我国网民规模达7.72亿,超过美国和欧洲网民总和,网络普及率达到55.8%,超过全球平均水平(51.7%)4.1个百分点,超过亚洲平均水平(46.7%)9.1个百分点,如图1-5所示。

image.png

中国互联网经济的快速发展催生了百度、阿里巴巴、腾讯、搜狗等一大批互联网企业和平台,每天中国的网民通过这些平台产生大量的数据。微信数据报告显示,2017年9月微信日平均登录次数达9亿次,日发送消息次数达380亿次,语音次数为61亿次;百度积累了万亿量级的互联网网页数据,支持千亿级样本和参数,每天响应几十亿次搜索请求。百度拥有超过60亿的日搜索量,14款亿级用户APP和超过10亿的移动设备,可在底层建立10亿身份要素、数十亿全网设备数据、上千亿全网行为数据,拥有覆盖95%以上的中国网民的大数据能力。搜狗输入法日活用户达到3.3亿,日均语音请求量峰值超过3亿次。中国人每天通过搜狗输入法产生的中文输入达到900亿次。在2017年的双十一活动中,淘宝就产生了大量的数据,销售额达到2539亿,产生包裹13.8亿个,每秒处理交易25.6万笔。可以说,在过去近三十年里,除了改革开放带来的巨大经济成就,我们还搭上了互联网这趟高速列车,产生了一批在国际上具有影响力的互联网平台,加上我国庞大的互联网网民数量和完善的基础设施,产生了大量有价值的数据、音频、视频、图像、文字等数据,为我国大数据产业和人工智能技术的应用发展提供了基础。
金融业在利用信息技术、拥抱互联网方面也是非常积极的,同时信息技术和互联网的发展也深刻影响着金融业。麦肯锡全球研究院的研究显示,中国已经成为消费驱动型数字经济的全球领导者。麦肯锡“中国行业数字化指数”揭示了中国存在着五类数字化水平相近的产业集群。在中国,信息和通信技术(ICT)、媒体和金融(产业集群1)等行业的数字化程度最高,如图1-6所示。

image.png

另一方面,随着金融业数字化水平的提高,金融机构在开展业务过程中积累了海量的高价值数据,其中包括客户身份、资产负债情况、资金收付交易等。以银行业为例,其数据强度高居各行业之首—银行业每创收100万美元,平均就会产生820GB的数据(波士顿咨询),如图1-7所示。截至“十二五”期末,主要银行业金融机构的网上银行、手机银行账户数达到21.6亿户,主要电子交易笔数替代率平均达到72.1%,累计发行金融IC卡21.1亿张。

image.png

因此,总体来看,随着信息技术的发展和互联网经济逐渐向传统产业渗透,我国凭借人口红利和良好的信息基础设施在数字经济时代占据领先优势,在微信、微博、淘宝、百度、搜狗等互联网平台上产生了海量的数据,这些海量数据都为人工智能技术的应用和发展创造了条件。同时,金融业在应用信息技术和数字化转型方面引领传统行业,并且金融业与数据有着天然的联系,我们的交易、转账、消费、购买等行为都会在金融机构后台留下数据,这也为金融业应用大数据和人工智能技术提供了有价值的海量数据。所以,在互联网经济的冲击下,传统经济逐渐向互联网经济转型,金融机构的业务也在从线下转到线上,业务流程也在向数字化转型,这一切都为金融大变革埋下了伏笔。

新兴技术融合:开启金融大变革时代

互联网时代的到来引发了一系列的技术革命,移动互联网、大数据、云计算、物联网、无人驾驶、可穿戴设备、人工智能、区块链等新兴技术的加快融合引领人类社会进入了数字革命时代。世界经济论坛创始人施瓦布在《第四次工业革命》一书中写道,“这次革命刚刚开始,正在彻底颠覆我们的生活、工作和互相关联的方式。无论规模、广度还是复杂程度,第四次工业革命都与人类过去经历的变革截然不同。”第四次工业革命最显著的特点就是多种新兴技术的融合对传统行业带来的变革,而金融业则首当其冲,移动互联网、大数据、云计算、人工智能和区块链等新兴技术的不断融合催生了金融科技的崛起,对传统金融业形成了革命性冲击,也开启了金融大变革时代的大幕。
计算机和互联网在一开始就首先对银行业带来了冲击。互联网以其低成本、广覆盖和传播广泛的优势率先在银行业得到了应用,1994年4月,全球第一家通过互联网提供银行服务的银行—美国安全第一网络银行(SFNB,Security First Network Bank)成立。此后,1995年10月美国第一联合国家银行在互联网上开展业务。1996年2月,中国银行开始通过互联网提供银行服务信息。招商银行在1997年推出网上银行—“一网通”,建立起由企业银行、个人银行、网上证券、网上商城、网上支付组成的全方位金融服务体系。此后经过近20年的发展,互联网对金融业的颠覆和冲击进一步显现,PayPal、蚂蚁金服、京东金融、陆金所等新型互联网金融模式的陆续出现将互联网金融带向高潮,也引发了以P2P、股权众筹等互联网金融模式的爆发式增长。2017年,我国网络借贷行业成交量达到了28048.49亿元,网络借贷行业历史累计成交量突破6万亿大关。
云计算的出现以全新的计算资源交付和使用方式作为出发点,从根本上颠覆了传统的信息技术,并对传统的金融信息基础设施带来颠覆性的影响,并进而影响金融机构内部资源配置和组织模式。云计算在金融领域的应用主要以金融云的形式出现,金融云通过提供科技支撑,使中小微金融机构更专注于金融业的创新发展,实现集约化、规模化与专业化发展,促进金融业务与信息科技的融合。在中国云计算市场中,阿里云市场优势明显,根据IDC报告显示,2017年上半年阿里云在中国公共云市场占有率为47.6%,为市场追随者的总和,也是市场第二位腾讯云的5倍。同时,根据计世资讯发布的研究报告,2016年中国金融云市场整体规模为43.4亿元,其中IaaS(基础设施即服务)市场占有率中,华为、云宏、九州云等厂商位居前列。在金融云PaaS(平台即服务)市场上,Red Hat 和Pivotal 以及BoCloud博云处于领先地位。云计算结合大数据以及人工智能技术,不仅改变了金融机构的IT架构,也使得其能够随时随地访问客户,为客户提供方便的服务,改变了金融行业的服务模式和行业格局。
如果说互联网和移动互联网的普及和渗透彻底拉开了金融业变革的序幕,云计算整合了金融机构的传统IT系统,建立起全新的金融信息基础设施,那么大数据则是加快金融变革的催化剂。大数据技术的出现和应用彻底唤醒了金融体系内部沉淀下来的海量数据,金融机构可以借助大数据技术深入挖掘数据背后的价值,提升金融机构决策效率,精准应对市场变化,提高数据资产管理能力,更好地发现客户需求,实现精准营销。目前,大数据在金融行业应用广泛,覆盖了中央银行、商业银行、保险、证券投资等领域,可以说大数据技术已经渗透到了金融各个细分领域,同时也在征信、反洗钱、风控、智能投顾、银行贷款、第三方支付、保险定价等领域得到了广泛的应用,并且为金融机构业务模式变革发挥了重要的推动作用。
人工智能技术的突破则引领金融大变革走向高潮。自从近年AlphaGo打败了人类围棋高手柯洁以来,有关人工智能取代人类的争论和观点就不绝于耳。毫无疑问,人工智能技术会对人类社会带来重大变革,其中金融领域首当其冲。目前,我们可以看到人工智能对金融领域的冲击已经开始显现出来,尤其是近年来人工智能技术的广泛应用对传统金融业务模式和业务流程带来的冲击,已经让我们感受到了人工智能改变金融业的威力。2017年年初,高盛宣布股票交易员将由最高峰时的600人裁减到2人,大部分工作将由机器完成。同年4月管理近5万亿美元资产的黑石集团宣布计划裁员400人,将用人工智能技术取而代之。无论是传统金融机构还是新兴的金融科技企业都将人工智能作为未来重要的战略方向,纷纷在人才、技术、资金方面加大投入力度,同时加强与外部的合作,争取在未来智能金融的发展中获得先机。
区块链有可能是未来变革金融业的主要推手。作为比特币底层技术的区块链,因为具有分布式、去中介化、去信任、透明可靠、不可篡改以及安全等诸多特性,近年来受到了金融机构的高度重视。区块链未来的潜力在于其能够重构信用创造机制,打破组织边界,降低监管成本,在某些领域可以大幅提高金融效率。目前,全球范围内各大知名高科技企业和金融机构,如谷歌、IBM、高盛、摩根大通、桑坦德银行、BBVA以及国内的工/农/中/建四大行、招商银行、平安银行等均在区块链领域进行了布局,探索在金融领域利用区块链技术改造传统的金融业务。目前,区块链在贸易金融(中国建设银行浙江省分行)、跨境支付(瑞波、招商银行)、资产证券化(京东金融)、去中心化交易所(纳斯达克LinQ)、银团贷款(Fusion LenderComm)、债券发行(澳大利亚联邦银行)等领域得到了应用,区块链目前在金融领域的应用还处于初级阶段,部分应用案例还没有得到大规模推广。但是,我们可以预见到在未来5~10年,区块链技术的不断成熟和完善会对金融业传统运作模式带来重大影响和冲击。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
95 3
|
2月前
|
机器学习/深度学习 人工智能 物联网
通义灵码在人工智能与机器学习领域的应用
通义灵码不仅在物联网领域表现出色,还在人工智能、机器学习、金融、医疗和教育等领域展现出广泛应用前景。本文探讨了其在这些领域的具体应用,如模型训练、风险评估、医疗影像诊断等,并总结了其提高开发效率、降低门槛、促进合作和推动创新的优势。
通义灵码在人工智能与机器学习领域的应用
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习:探索未来的技术边界
【10月更文挑战第18天】 在这篇文章中,我们将深入探讨人工智能(AI)和机器学习(ML)的基础知识、应用领域以及未来趋势。通过对比分析,我们将揭示这些技术如何改变我们的生活和工作方式,并预测它们在未来可能带来的影响。文章旨在为读者提供一个全面而深入的理解,帮助他们更好地把握这一领域的发展趋势。
|
1月前
|
机器学习/深度学习 传感器 人工智能
人工智能与机器学习:改变未来的力量####
【10月更文挑战第21天】 在本文中,我们将深入探讨人工智能(AI)和机器学习(ML)的基本概念、发展历程及其在未来可能带来的革命性变化。通过分析当前最前沿的技术和应用案例,揭示AI和ML如何正在重塑各行各业,并展望它们在未来十年的潜在影响。 ####
93 27
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
59 12
|
2月前
|
机器学习/深度学习 人工智能 算法
人工智能与机器学习的融合之旅
【10月更文挑战第37天】本文将探讨AI和机器学习如何相互交织,共同推动技术发展的边界。我们将深入分析这两个概念,了解它们是如何互相影响,以及这种融合如何塑造我们的未来。文章不仅会揭示AI和机器学习之间的联系,还会通过实际案例展示它们如何协同工作,以解决现实世界的问题。
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
146 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之解释性AI与可解释性机器学习
随着人工智能技术的广泛应用,机器学习模型越来越多地被用于决策过程。然而,这些模型,尤其是深度学习模型,通常被视为“黑箱”,难以理解其背后的决策逻辑。解释性AI(Explainable AI, XAI)和可解释性机器学习(Interpretable Machine Learning, IML)旨在解决这个问题,使模型的决策过程透明、可信。
101 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
揭秘AI:机器学习的魔法与代码
【10月更文挑战第33天】本文将带你走进AI的世界,了解机器学习的原理和应用。我们将通过Python代码示例,展示如何实现一个简单的线性回归模型。无论你是AI新手还是有经验的开发者,这篇文章都会给你带来新的启示。让我们一起探索AI的奥秘吧!
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能与机器学习的边界####
本文深入探讨了人工智能(AI)与机器学习(ML)领域的最新进展,重点分析了深度学习技术如何推动AI的边界不断扩展。通过具体案例研究,揭示了这些技术在图像识别、自然语言处理和自动驾驶等领域的应用现状及未来趋势。同时,文章还讨论了当前面临的挑战,如数据隐私、算法偏见和可解释性问题,并提出了相应的解决策略。 ####