金融行业的大数据应用之路

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

大数据产业发展进入了高速发展的快车道之后,很多企业经意识到了数据价值,不断加大数据领域的投资。特别是金融行业,在大数据领域的商业应用已经走到了其他行业的前面。

大数据

金融行业具有信息化程度高,数据质量好,数据维度全,数据场景多的特点,因此大数据应用的成熟度较高,数据应用也取得了较好的成绩。特别是一些股份制商业银行的信用卡中心、领先的保险、证券企业,大数据应用已经取得的成效,得到了行业的认可。

在全世界大数据领域投资中,90%的投资都投向了数据清洗、数据整合,数据计算和存储,数据分析和应用方面仅占投资的10%,外部数据价值应用更是少的可怜,中国市场数据交易的总额还不到10亿人民币,数据交易和数据产品处于一个初级阶段。

金融企业在大数据场景落地方面遇到很多的困难,内心对大数据商业应用非常渴望,但在实际数据应用过程中,面临着很多问题,数据对企业的发展影响很小。渴望找到一条有效的道路,帮助金融企业实现大数据场景落地。

大数据应用和场景落地在领先的金融企业也历经了若干年,经历了很多挫折之后才找到了一条有效的道路。对这些成功实施大数据场景落地的企业进行调研之后,总结了他们共有的一些经验。这些经验可以帮助金融企业,找到一条有效的捷径,避免踩更多的坑。

一般来讲,大数据在金融企业实现场景落地分为五步,分别是专业化团队、业务和数据梳理、外部咨询和工具的引入、业务场景的数据变现、高层汇报和支持。

一、建立专业数据应用团队

理想情况,企业的任何一个部门都需要数据分析和应用,需要数据分析人才帮助企业进行数据决策。中国企业刚刚走完信息化之路,数据型运营的企业不多,每个部门建立自己的数据分析团队是不现实的。并且数据分析和应用具有较高的技术门槛,市场上缺少足够的人才,企业还是要建立独立的数据应用团队,来提升数据应用能力。

金融企业数据意识和数据思维还在发展之中,业务人员可以通过项目来参与数据应用,缺少业务人员参与的数据项目,会离商业应用较远,也很难得到业务部门的支持。

科技人员和数据人员在数据应用中的视角同业务人员不同,科技人员更加关注技术架构,处理效率,以及可扩展性;数据人员关注数据质量、数据纬度、数据的实时性;业务人员关注的是业务场景,商业价值,收入和成本。这些关注点对于数据应用项目都是必需的,需要互相平衡。大数据应用建议采用项目组的形式更加有效,特别是寻找数据应用场景和实现数据变现方面。

独立的数据应用团队可以建立在业务部门内部,也可以建立在科技部门内部,从效率和推动力方面,建立在科技部门内部的数据分析团队,项目执行效率会更高。国外金融企业数据部门大多数也是属于技术部门的一个分支,并且服务于所有业务部门。

20160606115713947.jpg

一般情况下,金融企业的科技人员应该在5%以上,其中从事数据分析和应用的人员应该不少于科技人员的10%。美国领先的投资银行高盛银行,员工在3万人左右,其从事科技的人员达到了9000人,占其员工总数的三分之一。高盛的董事长经常开玩笑说,高盛更像一家科技公司。国内领先的工商银行员工接近40万,但是科技人员不到3万人,从事数据分析和应用的人才更是少于几百人,而阿里巴巴集团员工3万多人,从事数据挖掘和分析的科学家超过了1000人。

二、梳理数据和业务需求

大数据价值应用是建立在信息化基础之上的,金融企业大部分都已经完成了信息化。客户服务、业务处理、后台操作的各个环节都实现了信息化和数据化。金融企业内部拥有海量、多维度、高质量的数据,过去这些数据主要用于金融企业的财务分析、运营分析、风险管理。在客户洞察、业务支持、营销推广、精细运营等方面应用较少。

大数据在金融企业的应用切入点可以从业务的需求和痛点开始,也可以从数据的整理和统计入手。一般建议从业务的需求和痛点开始,将战略目标和业务目标进行分解。分解后的目标再次映射到具体到运营和营销活动之中,最后将营销和运营活动落实到数据分析需求之上。简单的讲就是讲业务目标分解到具体工作,将具体工作分解到数据分析需求,利用数据分析结果来支撑运营和营销活动。

金融企业到业务目标一般可以分为资产规模、产品收入、用户规模、交易费用等四个方面。资产规模可以分解到产品销售、有效客户、单个客户价值等几个方面;产品收入可以分解为客户规模、客户活跃、单客价值、持有时间、产品种类等几个方面;用户规模可以分解为用户总数、活跃客户、休眠客户、新增客户、流失客户等几个方面;交易费用可以分解为活跃客户、单客价值、交易频率、交易间隔、交易产品等几个方面。

金融企业可以利用数据分析来了解企业在各个方面的运营表现包括客户分布、客户价值、客户活跃、产品销售、交易频率、客户流失、客户休眠等数据,利用数据分析的结果进行决策。例如增加20%的高价值客户比例,增加客户活跃度,增加热销产品比例,实施高净值客户挽留,提升客户交易频率,激活休眠客户,增加目标客户,缩短购买间隔时间等。一切的营销活动将参考数据分析的结果,包括客户的行为数据和客户的交易数据,以及产品销售数据和客户体验数据等。这种数据变现的思路是将可以目标分析成用户经营行动,利用海量行为和交易数据来实现用户经营。

另外一种数据应用途径是整理海量数据,进行统计分析和数据挖掘,从数据分析和挖掘的结果来找到数据应用的场景,从而推动业务发展。这条路比较苦,适合信息化程度高,具有大数据治理和分析能力的成熟金融企业。从数据分析入手来寻找数据应用场景,会陷入技术怪圈,容易追求全量数据分析,全维度数据引入,追求完美技术架构,完美数据应用工具的怪圈。国内某著名四大国有银行中的一个,在升级改造新核心系统和大数据应用过程中,耗用了几千人,投入了几百个亿,花费了五六年,现在还在不断投入中。企业累、员工累、厂商累,大家都伤不起呀。

大数据应用过程中,数据治理、多数据源整合是一个脏活累活。美国大数据企业90%的资源都投入在数据采集、清洗、处理、整合等方面,只有10%的投资用户数据的分析和应用。多数据源的整合和处理是行业的一个难题,哪个大数据企业能够在这个方面取得突破,这个大数据企业就会取得市场领先优势。

三、引入外部工具和咨询

大数据是一个实实在在技术驱动的产业,金融行业具有数据和应用场景,但是金融行业不具备大数据平台和工具的开发能力。特别是非结构化数据的采集、处理和分析能力。

术业有专攻,科技企业的优势在于技术的专研,特别是多数据源的处理和整合。金融企业内部的数据质量较好,以结构化数据为主,内部已有的数据仓库和BI系统基本上可以满足需要。一般情况下在数据量低于20T,用户数量低于50万时,传统的数据仓库和分析工具可以满足数据分析需要。如果需要处理的数据超过了20T,用户数量超过50万,传统数据平台的投资会高于几千万,投入资金巨大,未来维护成本也很高。这种情况建议金融企业利用大数据平台来处理。在这个量级以上大数据平台处理效率比传统的数据仓库要高很多,总的投资费用和维护费用也要低的很多。

金融企业希望像互联网企业一样,通过采集非结构化行为数据来了解客户行为,提高客户体验,优化交易流程,提高客户活跃程度。非结构化数据采集和处理过程中,需要面对非常复杂的情况,例如客户使用设备类型、操作系统、采集的数据类型、非结构化数据ETL处理、数据采集和分析、数据建模和计算等。这些工作具有较高的技术门槛,大数据公司投入了巨大的研发资源,经过几年的发展,踩了无数个坑,迭代了很多次之后,才找到了一条比较靠谱的技术路线和处理架构。

金融企业在大数据技术研发方面不具有优势,不能够像互联网公司一样,拥有强大的基础技术研发应用团队。金融行业科技部门的优势是对金融业务的了解和数据环境的了解,数据治理和业务系统,不是大数据技术研发和应用。

中国大型国有银行拥有上万名技术开发员工,其技术优势是对银行核心业务系统的了解和应用,但对于基础软件例如数据库和中间件,大数据采集、存储、处理平台不具备研发能力。国有五大行一直在研发自己的非结构化数据采集处理分析平台,投入巨大,几年下来没有任何结果,没到达到应用水平。反而证券公司和股份制商业银行采用市场上成熟的大数据解决方案,上线了一些非机构化数据采集统计分析平台,2013年就开始商用了,在用户行为洞察和应用上取得了一些成果。

如果金融企业想拥抱移动互联网,洞察客户,提升App体验,利用数据分析和数据运营来创造价值,建议引入互联网人才和外部数据运营咨询服务。可以帮助金融企业短时间内完成数据治理,竞品分析,体验提升,数据分析,数字化运营甚至运营数据等工作。数据运营咨询可以快速提升金融企业的移动互联网运营能力,提高用户活跃覆盖率和活跃程度,并帮助金融企业从移动互联网获得大量客户和业务。

在数据工具和数据咨询方面,哪些金融企业引入的早,哪些企业就会取得业务上的领先。移动互联网是开放的,没有围墙。移动互联网的用户资源有限,用户需求有限,就看哪一家金融企业可以更早提升移动互联网运营能力,更早一些赢得客户,赢得市场。

20160606115713225.png

  四、寻找数据应用场景和实时分析业务运营情况

数字化思维是数据场景应用的基础,数字思维会提升企业的数据商业敏感度,帮助企业从数据中发现价值,也可以引导企业选择正确的数字化商业进程。客观地说,数字化商业进程未来是所有企业必须经历的阶段,也是企业发展的未来。

数字化商业是逐渐进化的过程,不能一促即成,需要不断的进行尝试,可能也需要不断试错。这个过程既不能空想一天建成,投入巨大财力和人力,进行大规模建设。像某个大型国有银行,投入百亿资金,投入几千人,两年未有结果。也不能像另外的企业,裹布不前,不断调研,一年下来没有任何变化。就像马云说的,这是个抢钱的时代,当你还在想商业模式时,别人已经跑马圈地,走在了时代的前沿,剩下的只有后悔和遗憾了。

平安集团就是金融行业的阿里,这几年已经走在了大多数金融企业的前面,其集团内部从事数据分析和挖掘的员工就有几百人,领先于其他的金融企业,数据场景应用其实并不复杂,业务需求同数据相结合,数据应用场景即刻就会呈现。国外同行的案例告诉我们,数据场景的应用往往建立在数据分析和业务分析之上。从商业应用场景出发,很容易找到数据应用场景。例如花旗银行信用卡直接利用乘客头等舱乘坐记录来给客户寄送白金卡;某银行利用物业费缴费情况,直接找到高端财富人群;某保险公司利用社交传播,直接吸引了高端保险客户;某互联网金融公司利用外部数据,提高了30%左右恶意欺诈用户识别率;手机短信可以揭示客户收入水平等,这些都是很典型的数据应用场景。

数据场景应用来源于业务人员对数据的商业敏感度,同时也来源于数据分析人员对业务场景对了解,另外对外部数据应用案例和外部数据源的了解,也会帮助企业提高数据场景应用能力。数据的流通、数据案例的分享、数据场景的交流、同行人员的头脑风暴都会帮助企业找到数据应用场景。

数据场景应用可以从两个纬度进行,一个是从企业的痛点和业务需求入手,寻找相关数据,进行数据汇聚整理和分析,找到数据应用场景。另外一个纬度是从数据汇聚和整理出发,通过数据分析来了解业务运营环境和用户特点,围绕用户进行数据营销和业务运营,提升单个客户收入价值和客户规模,以及客户活跃程度。

业务运营数据的实时展示也是金融客户的一个需求。过去数据实时展示主要应用于数据中心网络和系统的运行监控,现在业务管理人员需要及时了解业务指标运营情况,便于及时调整产品营销策略。业务运营指标实时展示的基础,是可以实时处理业务数据和行为数据的大数据管理平台,其可以帮助金融企业实时进行数据处理和分析,通过大屏的方式展现给客户,帮助企业实时了解客户交易行为和交易数据,以及分析结果,帮助企业进行决策。另外企业可以借助于大数据管理平台(DMP)进行数据分析和挖掘,洞察客户群体,经营客户,实时进行数据营销,完成数据场景变现。

五、同领导进行汇报得到支持

任何一件事情,临门一脚都是非常重要的。中国一句古话,编筐编篓全在收口,大数据应用也是如此。数据在项目和企业的价值必须让企业的决策者了解,这样才能得到管理者的支持,得到更多的资源,持续利用数据创造价值。

金融企业的决策者不关心实施细节,但是关心业务逻辑和业务效果,因此在进行高层汇报时,建议从商业逻辑角度出发,从商业价值角度出发进行汇报。千万不要纠结在技术逻辑和技术架构。汇报采用方式多以对比法为主,分析没有数据支持下的业务决策以及效果;强调在数据分析和支持的情况下,业务效果的不同。如果数据分析和数据应用还没有取得效果,建议晚一些汇报。

汇报也可以采用趋势分析法告诉管理者,过去发生了什么,为什么发生,需要提高的方面。在数据分析和决策之后,未来将会发生什么,会有哪些提高。另外切记不要汇报领导已经知道的数据和结果,需要汇报过去隐藏在数据分析背后的结果。例如单个资产拥有最多的客户,客户交易特点和习惯,客户年龄分布,不同年龄客户的资产情况,开户来源渠道,客户活跃时段,客户点击偏好,客户体验等过去没有分析多的数据。

大数据持续在金融企业进行场景落地,需要不断寻找数据应用场景,同时也需要不断进行高层汇报,让管理层了解数据价值,得到相应的支持。管理层更加了解企业未来的战略和市场,其给出的业务建议更加简单有效,更能够体现数据运营价值。

总之,金融企业可以借助于五步法实现大数据在金融企业的场景化落地,术业有专攻,专业的人做专业的事,金融企业专注于业务和用户,大数据企业专注于数据处理和工具,大家分工不同,但是目的相同,就是利用数据了解企业运营环境,数字化运营业务,利用数据分析来提升业务,未来从数据运营走向运营数据。



本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5天前
|
机器学习/深度学习 数据可视化 大数据
阿里云大数据的应用示例
阿里云大数据应用平台为企业提供高效数据处理与业务洞察工具,涵盖Quick BI、DataV及PAI等核心产品。DT203课程通过实践教学,帮助学员掌握数据可视化、报表设计及机器学习分析技能,提升数据驱动决策能力。Quick BI简化复杂数据分析,DataV打造震撼可视化大屏,PAI支持全面的数据挖掘与算法应用。课程面向CSP、ISV及数据工程师等专业人士,为期两天,结合面授与实验,助力企业加速数字化转型。完成课程后,学员将熟练使用阿里云工具进行数据处理与分析。[了解更多](https://edu.aliyun.com/training/DT203)
|
7天前
|
消息中间件 SQL 大数据
Hologres 在大数据实时处理中的应用
【9月更文第1天】随着大数据技术的发展,实时数据处理成为企业获取竞争优势的关键。传统的批处理框架虽然在处理大量历史数据时表现出色,但在应对实时数据流时却显得力不从心。阿里云的 Hologres 是一款全托管、实时的交互式分析服务,它不仅支持 SQL 查询,还能够与 Kafka、MaxCompute 等多种数据源无缝对接,非常适合于实时数据处理和分析。
29 2
|
16天前
|
分布式计算 大数据 数据处理
Apache Spark的应用与优势:解锁大数据处理的无限潜能
【8月更文挑战第23天】Apache Spark以其卓越的性能、易用性、通用性、弹性与可扩展性以及丰富的生态系统,在大数据处理领域展现出了强大的竞争力和广泛的应用前景。随着大数据技术的不断发展和普及,Spark必将成为企业实现数字化转型和业务创新的重要工具。未来,我们有理由相信,Spark将继续引领大数据处理技术的发展潮流,为企业创造更大的价值。
|
23天前
|
存储 机器学习/深度学习 数据采集
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
|
23天前
|
存储 缓存 NoSQL
深入解析Memcached:内部机制、存储结构及在大数据中的应用
深入解析Memcached:内部机制、存储结构及在大数据中的应用
|
27天前
|
机器学习/深度学习 设计模式 人工智能
面向对象方法在AIGC和大数据集成项目中的应用
【8月更文第12天】随着人工智能生成内容(AIGC)和大数据技术的快速发展,企业面临着前所未有的挑战和机遇。AIGC技术能够自动产生高质量的内容,而大数据技术则能提供海量数据的支持,两者的结合为企业提供了强大的竞争优势。然而,要充分利用这些技术,就需要构建一个既能处理大规模数据又能高效集成机器学习模型的集成框架。面向对象编程(OOP)以其封装性、继承性和多态性等特点,在构建这样的复杂系统中扮演着至关重要的角色。
43 3
|
8天前
|
存储 SQL 分布式计算
MaxCompute 在大规模数据仓库中的应用
【8月更文第31天】随着大数据时代的到来,企业面临着海量数据的存储、处理和分析挑战。传统的数据仓库解决方案在面对PB级甚至EB级的数据规模时,往往显得力不从心。阿里云的 MaxCompute(原名 ODPS)是一个专为大规模数据处理设计的服务平台,它提供了强大的数据存储和计算能力,非常适合构建和管理大型数据仓库。本文将探讨 MaxCompute 在大规模数据仓库中的应用,并展示其相对于传统数据仓库的优势。
29 0
|
12天前
|
存储 关系型数据库 大数据
PolarDB 大数据处理能力及其应用场景
【8月更文第27天】随着数据量的爆炸性增长,传统的数据库系统面临着存储和处理大规模数据集的挑战。阿里云的 PolarDB 是一种兼容 MySQL、PostgreSQL 和高度可扩展的关系型数据库服务,它通过其独特的架构设计,能够有效地支持海量数据的存储和查询需求。
29 0
|
13天前
|
机器学习/深度学习 监控 大数据
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
|
19天前
|
分布式计算 Hadoop 大数据
大数据处理框架在零售业的应用:Apache Hadoop与Apache Spark
【8月更文挑战第20天】Apache Hadoop和Apache Spark为处理海量零售户数据提供了强大的支持
32 0

热门文章

最新文章

下一篇
DDNS