陈磊-大数据风控:拍拍信的AI视角

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
 普惠金融的发展遇到移动化的浪潮,使得消费信贷迎来了高速攀升期,同时也给风控带来了巨大的挑战,即在额度区间广、借贷频次高、客群下沉情况下,如    何实现风险可控、差异化定价、快速审批。幸而大数据和AI技术使得这一切变为可能,拍拍信一直在做这方面的探索,旨在整合数据资源、充分发掘数据潜在  价值,帮助金融机构伙伴搭建和优化风控系统,本次陈磊将分享相关的实践经验和落地案例。

当前消费金融规模持续增长,风险控制的挑战也与日俱增。

陈磊老师现场分享

请参见一个风控系统的雏形框架,涵盖了用户贷前和贷后的流程。

信息是为决策提供主要支撑。在信贷业务中,信息四要素是姓名、身份证、手机号、银行卡号。

比如在信息采集上,我们会用AI的技术来提取相关信息,比如OCR,用拍照的方式来提供身份证、银行卡号的信息。这样做的优点显而易见——提高用户体验,效率快,避免伪造的情况。

整个闭环模式中,我们会根据不同的客户发起不同的策略,对于优质客户会提高额度,同时我们也会避免不良资产导致坏账而采取措施。

风险流程就是一个数据的流程,包含数据的采集,消化、回收、落地。

离开数据,风控就是无水之源。

传统的风控数据就是征信类的数据,很显然,这是远远不够的。那么新型时代的发展也让我们有新的思考,有哪些数据可以为我们的风控作补充。

理想化的数据就是覆盖率高,又和风险高度相关的。

这里我们借用金字塔模式来介绍的可用数据:


我们在数据大爆炸的年代,什么样的数据都可以使用。

但是怎么使用,确实一个挑战。

这些挑战来源于以下几个维度:

在传统银行的风控体系中,无论是采用机器学习,还是人工标记,都需要专家来看怎么去做,如何做才能发挥作用。

鉴于特征提取都是以人为主,这就难免会有局限性,很多高维度、宽广度的数据衍生出来新的特征就很难用经验进行捕捉。 

下图是google在使用的一个专家+机器的特征工程模型框架:

  • 左边是比较明显的广度特征,专家可以凭经验直接提取

  • 中间广度加深度模型,一些不易解读的数据需要加工重构才能得以解读

  • 右面是需要深层挖掘、层层解析后才会出来的特征

下面是一份团案信息图谱的案例:

信息图谱在业务上的所反映的问题,在于最原始的出发点是什么, 什么形式关联,在关联上有什么途径。一层关联比较简单,怎样能够发现多层关联才更为关键。

从聚合数据的输出与查询,可以看出一步关联与二次关联的数据联系。

而更深层次的特征查询,能对关系网络形态位置,把非结构化的关系网络转化为一般模型可以能吸收并消化的特征向量,从而检测到异常客户。

以上讲了很多特征提取。下面是阐述如何落地,从图中模型可以看出,主要流程是对不同的数据源做不同的数据提取,抽象到几个风险因子,进而提炼出综合风险指数,化繁为简。


在风控体系中,我们追求准确性,同时也强调健壮性。

准确性是指特征的抽象与提取,那么健壮性就是指时间维度上的有效性、场景迁移的可扩展性。

原文发布时间为:2017-10-24

本文作者:陈磊

本文来自云栖社区合作伙伴“中生代技术”,了解相关信息可以关注“中生代技术”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
192 17
|
1月前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
2月前
|
数据采集 人工智能 安全
AI大数据处理与分析实战--体育问卷分析
本文是关于使用AI进行大数据处理与分析的实战案例,详细记录了对深圳市义务教育阶段学校“每天一节体育课”网络问卷的分析过程,包括数据概览、交互Prompt、代码处理、年级和学校维度的深入分析,以及通过AI工具辅助得出的分析结果和结论。
|
2月前
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
2月前
|
人工智能 分布式计算 架构师
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
|
2月前
|
存储 人工智能 算法
AI与大数据的结合:案例分析与技术探讨
【8月更文挑战第22天】AI与大数据的结合为各行各业带来了前所未有的机遇和挑战。通过具体案例分析可以看出,AI与大数据在电商、智能驾驶、医疗等领域的应用已经取得了显著成效。未来,随着技术的不断进步和应用场景的不断拓展,AI与大数据的结合将继续推动各行业的创新与变革。
|
2月前
|
SQL 人工智能 分布式计算
飞天发布时刻:大数据AI平台产品升级发布
阿里云飞天发布时刻产品发布会围绕阿里云大数据AI平台的新能力和新产品进行详细介绍。人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品均带来了相关发布的深度解读。
|
2月前
|
人工智能 分布式计算 大数据
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
|
6天前
|
人工智能 Serverless
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
|
1天前
|
机器学习/深度学习 人工智能 算法
介绍一下AI在药物研发中的应用。
【10月更文挑战第16天】介绍一下AI在药物研发中的应用。
7 0