大数据与银行风险管理革命

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

商业银行风险管理者要具备充分的想象力和开创性,致力于实现商业银行风险数据的梳理、汇总及整合,并建立起统一、强大的风险数据管理体系,助力商业银行提升竞争力。

大数据正成为一种核心资源,就像农业时代的土地、工业时代的能源,其价值意义非凡。就银行业而言,互联网金融的蓬勃发展使得商业银行的风险数据从薄弱到丰富,客户与经营数据等成为银行业客户风险分析和定制化服务等的基础,也成为商业银行在电子商务时代难以复制的核心竞争力,如今,商业银行开始愈加重视互联网金融下的数据治理及大数据风险管理技术工作。

这一工作涉及商业银行业务经营和风险管理的方方面面。摆在商业银行面前的任务很多,比如,要明确数据质量管理组织架构,对数据质量持续评估、数据质量问题管理、数据质量主动提升及被动清洗以及数据质量执行评估的相关流程进行规范,采取银行业务、系统与数据的三位一体整合理念,持续推进数据标准与数据质量体系的建设,为风险管理能力的提升夯实技术与数据基础。

在大数据丰富的银行业,有必要培养以上充分挖掘、使用数据的技术和能力,否则再多的数据也没有价值。但,这并非是一蹴而就的,在某种程度上商业银行的数据治理工作可以说是一场革命,是一整套全新的体系和不同机制的实践。

数据治理组织架构

数据治理组织架构是确保数据治理目标能够得以实现的保障,各种管理制度、规范都必须依赖组织架构才能顺利施行。良好的数据治理组织架构,可以从全企业的视角协调、统筹各个层面的数据治理工作,明确部门职责与角色职责,建立跨部门的有效协作机制,保障数据治理体系正常运转。

基于成熟的数据治理方法论,有代表性的数据治理组织架构,如图1所示,其中包括董事会及高级管理层、数据治理委员会、数据治理主管部门以及数据治理执行部门。

作为数据治理的决策层,董事会、高级管理层与数据治理委员会需要高度重视并积极推动数据治理工作。银行董事会应制定明确的政策,将本行数据治理(涵盖数据标准管理与数据质量管理)纳入内控合规体系和战略规划之中,并定期对其有效性和执行情况进行评估。高级管理层,应确立数据治理的目标,明确职权和责任,定期对本行数据治理水平进行评估,并有效落实数据治理问责制。

商业银行数据治理组织架构形成后,数据治理的决策层、管理层及执行层需要互相支持并积极配合,共同提升全行数据治理认知程度,进而推进数据治理体系建设,从而保证全行数据管控工作的有效开展。

数据标准及数据质量管理流程

在数据治理组织架构形成的同时,还要建设数据标准管理流程及数据质量管理流程,并在数据治理工作中予以遵循。如图2所示,数据标准管理流程包括年度计划制订、数据标准制定、数据标准发布、数据标准落地执行,以及数据标准评估。

年度计划制订,是指基于银行年度业务管理目标与信息系统建设需求,并充分考虑外部监管要求及银行业务和技术发展对数据标准的要求,制订数据标准年度工作计划。数据标准主管部门应基于各部门对年度计划的建议,结合本部门的工作现状及实际需求,拟定年度计划,并报请数据治理委员会审阅。

数据标准制定,是指为确保数据标准有效反应银行业务发展变化情况,对其内容进行新增、修订、废止的过程。数据标准主管部门应根据年度工作计划开展数据标准制定工作,总行各部门、分行若有数据标准制定需求,应向主管部门提出,主管部门牵头进行标准制定。

数据标准发布,是指数据标准在全行范围内的公布,公布内容涵盖新增、修订及废止的最新标准结果。数据标准新增、修订、废止的内容,由数据标准主管部门通过全行发文的方式进行通告,并更新数据管控平台内的相关内容。

数据标准落地执行,指在日常业务管理中以及在信息系统建设中执行数据标准。数据标准主管部门负责牵头,并在科技部门的配合下监督和检查数据标准在全行系统中的落地执行情况,并对标准落地不到位的系统采取必要措施,以保证数据标准持续有效贯彻执行。

数据标准评估,是指对已发布的数据标准内容、数据标准执行、数据管控平台应用情况、数据标准管理工作等方面进行全面的评估,以确保数据标准管理能够适时反应业务需求的发展变化。评估周期原则上不超过一年,由数据标准主管部门基于调研结果,联合各部门拟定评估报告,并报请数据治理委员会审阅。

数据质量管理流程,包括年度计划制定、数据质量持续评估、数据质量问题管理、数据质量主动提升、数据质量被动清洗,以及数据质量工作评估,如图3所示。

年度计划制订,是指基于银行年度业务管理目标与信息系统建设需求,并充分考虑外部监管要求及行内业务及技术发展状况,制订数据质量年度工作计划。数据质量主管部门基于各部门对年度计划的建议,结合本部门的工作现状及实际需求,拟定年度计划。

数据质量持续评估,主要包括数据质量规则制定、数据质量评估方案制订、数据质量评估方案执行、数据质量评估报告制定四项工作内容。数据质量主管部门负责从业务系统、数据主题等评估对象出发,定期对其数据质量进行评估,并给出评估结果。

数据质量问题管理,主要包括数据质量问题收集、数据质量问题分析、整理、登记、数据质量问题状态变更三项工作内容。数据质量主管部门应基于部门日常工作,以及数据质量评估中发现的数据质量问题,结合数据标准制定内容,进行问题的持续跟踪与解决。

数据质量主动提升,主要包括主动提升发起、主动提升方案制定、主动提升方案执行三项工作内容。数据质量主管部门负责牵头,业务部门及科技部门共同完成主动提升工作,对数据质量问题进行根源性、彻底性地修正、包括存量数据清洗及业务功能完善。

数据质量被动清洗,主要包括被动清洗发起、被动清洗方案制订、被动清洗方案执行三项工作内容。数据质量主管部门负责牵头开展被动清洗工作,对存量数据进行临时性的清洗,以在短期内快速地解决存量数据的数据质量问题。

数据质量工作评估,是指对数据质量管理工作执行、数据管控平台应用情况等方面进行全面的评估,以确保数据质量管理能够适时反应业务需求的发展变化。评估周期原则上不超过一年,由主管部门基于对各部门的调研结果制定工作评估报告。

数据标准引用及数据质量评估体系

数据标准只有被持续应用到日常工作中,才能体现其价值并不断保持生命力。数据标准的持续应用,是一个全员参与、长期、坚持不懈的过程,需要各业务部门及科技将其当成一项日常工作,持续不断地坚持下去。业务人员及科技人员,需要在业务需求书、发文报告以及系统设计中,引用数据标准来规范相关数据项的各项属性,而数据标准主管部门在工作中,也应指导、协助并监督各部门更好地引用数据标准。

数据质量评估体系旨在全面地、准确地、客观地反映商业银行数据质量的当前状况。通过对数据质量规则的统一汇总及管理执行,结合相应数学模型,定量地评估数据质量好坏,同时,给出数据质量提升的优先顺序建议,从而为银行逐步提升数据质量打下坚实的基础。

数据质量评估体系,共包括评估维度与评估规则、评估方法、评估报告、数据管控平台四部分内容,如图4所示。

评估维度与评估规则是数据质量评估的基础,主要解决从什么角度、按照什么规范、执行什么规则来进行数据质量的评估。评估维度反映了对数据项进行质量评估的角度和关注点,根据先进商业银行的数据质量管理方法论,数据质量评估维度有规范性、完整性、准确性、一致性、唯一性。根据对数据项的质量要求的粒度不同,评估规则分为数据质量业务规则与数据质量技术规则两类。数据质量业务规则和具体系统无关,反映了在业务层面数据用户对数据质量的需求;数据质量技术规则是数据质量业务规则在系统中的应用,反映对系统中具体数据项质量评估的要求。

评估方法主要为解决在建立上述具体数据质量技术规则之后,如何对数据质量技术规则进行度量、按照什么算法对评估对象进行综合评分,从结构上分为评估形式、评估对象、权重矩阵、评估模型四大类。其中,评估形式是指对数据质量进行评估的形式,根据形式不同,分为主观评估法和客观评估法(实际应用中,以客观评估法为主,主观评估法为辅)。评估对象是开展数据质量评估的目标单元,如应用系统、数据主题、业务部门、评估维度、自定义数据集等,对某个具体评估对象开展数据质量评估时,实际上是对该评估对象下所含的所有数据质量技术规则执行结果的综合评估。由于不同的数据质量技术规则对评估对象的最终得分的贡献不同,因此需要针对每条数据质量技术规则设置对应的权重,考虑多种因素包括数据质量技术规则相关数据项所属系统的重要程度、相关数据项的约束类型、数据类别、评估维度等。各影响因素以及各影响因素的贡献程度共同构成数据质量技术规则的权重矩阵,通过权重矩阵来对每条数据质量技术规则设置权重。

每个评估对象下具有多条数据质量技术规则,评估模型主要是解决在通过客观评估法计算每条规则的具体得分且通过权重矩阵为每条数据质量技术规则赋予权重之后,通过什么算法来综合每条规则的具体得分和其对应的权重,获取评估对象的最终得分。在数据质量评估时,根据是否检核评估对象下的所有数据质量技术规则,评估模型分为分层抽样加权评估模型和全数据质量规则加权模型,为确保数据质量评估结果能够较全面地反应评估对象的质量好坏,当前在实践中,采用全数据质量规则加权模型。

评估报告旨在全面地、客观地、及时地向数据质量管控工作相关的决策层、管理层汇报评估对象的数据质量情况。根据汇报对象的不同,分为面向决策层和面向管理层的报告。

数据管控平台质量管理模块,是负责对上述评估维度和标准、评估方法、评估报告等内容进行装载和实现的应用信息系统平台,该平台的各项功能应配合投入正常使用。

数据治理的循序渐进

商业银行数据治理建设工作开展,数据治理整体框架的逐步形成,包括在数据治理体系架构、数据治理流程、数据标准、数据质量评估、数据管控平台等方面,均应形成丰富的产出,包括改善风险数据质量、建立风险数据集市,建立起风险数据质量标准(风险数据的类型、字段、存储数量、校验规则等);并按照数据质量标准通过内部产生或外部购买的方式开始收集积累风险数据。然而,数据治理工作并不是一蹴而就的,而是需要循序渐进,并坚持不懈地开展下去。

首先,数据标准建设工作。银行在数据标准建设时,制定基础数据标准和指标数据标准,同时,要基于风险数据集市、信贷系统数据字典、新建重要系统需求、风险监管报表中重要并广泛使用的数据项补充制定数据标准。此外,也应对网银、银行卡、贵金属、押品、渠道、风险模型等业务领域进行数据标准的完善工作。

其次,数据标准在信息系统建设中的应用。要在数据标准管理流程已经形成,管理办法已颁布基础上,针对所有新建系统,开展数据标准应用的落地执行检查。银行各相关部门需要在新建系统的业务需求规格说明书和系统规格说明书中,使用数据标准规范与其相关数据项的各项属性。同时,开发人员需要参考设计文档,使用数据标准规范系统中的相关字段;测试人员需要对数据标准的应用情况进行测试。

作为数据治理的重中之重,数据质量评估与提升也应常态化。在数据质量评估体系建设完成后,依托数据管控平台,可以对银行各业务系统、各部门、各数据主题等评估对象开展数据质量的评估与提升工作。为充分利用数据质量建设成果,还可以针对“信贷风险管理系统”、“零售信贷全流程系统”、“汽车金融服务系统”,以及“小企业系统”等,开展数据质量评估工作,对重大的数据质量问题进行成因分析及解决方案的研究,并逐步提升其数据质量。

应对风险数据变革的建议

我国商业银行风险数据缺乏规范性,风险数据缺乏统一标准,而大数据时代的商业银行的风险管理,则应体现为以数据为基础、计量模型为工具、风险指标为决策依据的体系。

商业银行风险管理者要具备充分的想象力和开创性,致力于实现商业银行风险数据的梳理、汇总及整合,并建立起统一、强大的风险数据管理体系,助力商业银行提升竞争力。

商业银行应推进风险管控思路的创新与变化,建立以大数据为基础、线上线下相融合的风险识别与计量模式。应借鉴国际经验,通过建立数据集市实现统一收集、整理和存储风险相关所有基础数据,实现基于大数据量模型的加工计算,统一基础数据、提升数据共享,有效降低系统复杂程度的同时提高数据处理速度并改进质量。此外,银行应积极向互联网经营模式渗透,通过电商化的服务积累客户在线交易与行为数据,同时银行可在合乎监管规定和保护金融消费者利益的前提下,与外界海关、工商、税务和互联网公司等开展数据互换与共享,提升客户数据价值。

(俞勇,恒丰银行首席风险官、中国人民大学兼职教授,清华大学深圳研究生院校外导师,先后在美国摩根大通银行、美国运通公司等从事新资本协议、战略规划、风险管理、金融衍生品交易与定价模型、金融信息安全等工作,曾任职于平安银行(000001,股吧)风险管理部兼新资本协议办公室总经理、中国银行业监督管理委员会监管二部,参与起草《商业银行资本充足率管理办法》等中国银行业监管法规文件,具有全面的国际银行先进风险管理工作经验和国内银行风险管理工作经验。著有《货币、银行与经济》、《银行全面风险管理与资本管理》、Asset Returns and Demographic Effects、Quality Choice Simulation and Implication Based on Individual Conjoint Analysis 等。本文来源于《当代金融家》杂志2015年第12期)

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
机器学习/深度学习 数据采集 算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
|
监控 安全 大数据
医疗保健的大数据革命如何为人们带来健康
医疗保健的大数据革命如何为人们带来健康
173 0
医疗保健的大数据革命如何为人们带来健康
|
人工智能 搜索推荐 算法
大数据催发在线教育新机遇 tutorabc制胜场景革命
大数据催发在线教育新机遇 tutorabc制胜场景革命
215 0
大数据催发在线教育新机遇 tutorabc制胜场景革命
|
机器学习/深度学习 算法 安全
|
分布式计算 监控 大数据
【行业|分析】大数据对于银行七大应用
大数据和Hadoop技术非常强大,可帮助金融机构在市场上保持领先。运用了这些技术就能看到他们传输的结果。
1970 0
|
分布式计算 关系型数据库 大数据
下一篇
无影云桌面