隐语发布“基于MPC的金融风控全链路技术方案”

简介: 隐语发布“基于MPC的金融风控全链路技术方案”


收录于合集#应用案例3个

过去几年,业界不断推进隐私计算在金融场景的实践探索。其中,多方安全计算(MPC)技术可实现对原始数据按用途授权使用,有效避免数据的二次流转,达到数据“可用并可控”相对更匹配金融行业的联合风控场景需求。多方安全计算技术在金融风控的贷前准入、贷中提额、贷后清退、金融反欺诈等场景中都有着巨大的应用价值,隐语开放平台此次发布的技术方案之所选择MPC路线深度打造,既是因其安全性上可证的优势,也是为金融风控量体裁衣,助力提升金融风控数据价值共享的安全水位,并对金融机构展示出MPC方案的通用性灵活性,降低整个金融行业数智升级改造成本、提升新安全协议业务接入效率。11月18日下午,蚂蚁集团隐私智能技术部总经理、隐语开源框架负责人王磊于2022年第五届中国金融科技产业峰会「金融安全与密码应用」论坛,发布了隐语——基于MPC的金融风控全链路技术方案”,本篇将展开各个环节具体内容及背后的技术支撑,进行详解。


01


与已有金融风控隐私计算差异何在?

金融风控的细分链路往往长而繁,每个环节都会面临数据安全的挑战,而为全链路提供高安全水位的MPC解决方案难度极高。此前,业界对全流程金融智能风控的研究还处在探索阶段,暂无公开的基于MPC的金融风控全链路解决方案。因为,训练风控模型只是金融风控的其中一环。在建模之前,往往还会涉及数据的探查、数据的加工与分析,在建模之后,还需要将模型服务化。对于隐私计算来说,无论是前期的数据分析、或是后期的模型服务所带来的难度,都不低于机器学习,甚至在MPC的数据分析领域的难度更超过了MPC机器学习。隐语能够实现此方案,一方面基于自身在MPC技术上的积累与研创,另一方面依托蚂蚁丰富的金融行业场景打磨沉淀,通过多年的创新、应用组合训练,才得以针对金融风控数据全生命周期高安全性的需求,实现了包括数据分析、特征预处理、模型训练、效果评估、模型服务化在内的全链路安全的数据处理能力,为多方数据合作场景提供了金融风控的全链路技术解决方案。

02


隐语MPC金融风控业务视角背后的技术详解

通过隐语开放平台体验金融风控中的必经业务步骤,可以分别找到其背后基于MPC的全链路技术支撑点。体验申请地址:https://survey.alipay.com/apps/zhiliao/FdC-vTsPM

1、数据注册

在数据资产注册环节,隐语即提供了独有的CCL(Column Control List)列安全约束功能,以应对后续所有环节中的数据安全隐患。该功能可支持联合项目的所有参与方在数据注册阶段,各自配置其数据资产的安全约束;在用户创建项目后,任何对数据的使用都会触发系统自动检查,确保后续所有操作都满足用户配置的安全约束。

2、样本对齐

隐语提供隐私安全求交PSI能力,在多方样本对齐处理过程中,保证样本交集外的无关数据不泄露。且在这一环节中,用户可根据多方样本的交集拼上多方特征,形成虚拟宽表用于后续的建模。

3、特征预处理

隐语提供了丰富的特征预处理组件,可满足用户进行空缺值/异常值处理、数据标准化、woe分箱等联合特征处理,配合特征统计组件如相关系数矩阵、全表统计、VIF指标计算,即可辅助用户完成多方安全数据分析的统计结果生成。

4、模型训练

隐语在隐私计算算法层面建设了一系列的通用机器学习算法,如逻辑回归、评分卡、XGB等算法,且平台提供了通用的组件配置项,业务可根据实际数据情况进行模型的选择和配置,按需应用于在金融风控贷前、贷中、贷后及反欺诈等场景。

5、模型预测

隐语支持模型服务化一键提交部署,提供测试环境验证、冒烟、灰度、重跑等一系列稳定性保障措施,确保性能达到生产级别。

6、监控和审计

针对模型上线服务,隐语提供了一系列业务指标监控能力,支持机器维度资源监控的同时,也能监控识别模型效果,在部分指标下降或出现异常数据时,可进行服务版本的升级;同时,平台提供了全链路审计的能力,所有平台操作和运行日志都可追溯、可审计,以进行多方安全模型迭代或问题排查。

目前,上述流程已可通过隐语开放平台进行体验,并且提供多种安全协议可供选择,可根据不同的业务场景选择不同的安全协议,达到安全、效率、效果的平衡。隐语开放平台已开放体验申请,欢迎申请试用!

03


隐语MPC金融风控全链路技术方案展望

金融风控全链路方案在保护数据源头方信息不泄露的前提下,可将更多维度信用数据纳入联合模型中,从而构建更精准的大数据信用风控模型。该技术方案的支持,可增进金融风控联合项目参与方彼此之间必要的协同与沟通,加速金融风控管理模式由传统手段向前沿技术的转型,服务于政府与金融业协同监管,更好地促进金融数据要素市场的建设。隐语未来的MPC全链路技术方案建设不仅针对金融风控,未来也将开放NN、DeepFM等营销推荐中常用的模型,与隐语的多方安全分析能力结合,逐步开放医疗、营销等更多场景的全链路方案,隐语开放平台还将在那时通过提供DAG行业建模模板、IDE代码模版,以便真切感受隐语的MPC全链路能力。此外,隐语开源框架V0.7.11代码也已发布,开发者可以调用代码进行定制化开发除本篇隐语开放平台功能详解,隐语开源社区也将面向开发者发布配套的交互式教程,敬请期待!

相关文章
|
5月前
|
数据采集 分布式计算 监控
新一代数据质量平台datavines
新一代数据质量平台datavines
511 0
|
编解码 算法 安全
瓴羊Dataphin隐私计算:数据安全流通方案-开源项目mpc4j
瓴羊Dataphin隐私计算:数据安全流通方案-开源项目mpc4j
444 0
|
5月前
|
自然语言处理 监控 Cloud Native
对话阿里云云原生产品负责人李国强:推进可观测产品与OpenTelemetry开源生态全面融合
阿里云宣布多款可观测产品全面升级,其中,应用实时监控服务 ARMS 在业内率先推进了与 OpenTelemetry 开源生态的全面融合,极大丰富了可观测的数据类型及规模,大幅增强了 ARMS 核心能力。本次阿里云 ARMS 产品全面升级的背景是什么?为什么会产生围绕 OpenTelemetry 进行产品演进的核心策略?在云原生、大模型等新型应用架构类型层出不穷的今天,又将如何为企业解决新的挑战?阿里云云原生应用平台产品负责人李国强接受采访解答了这些疑问,点击本文走进全新升级的阿里云可观测产品。
42003 11
|
5月前
大模型与其他业务系统打通是大模型产业落地的关键
【1月更文挑战第9天】大模型与其他业务系统打通是大模型产业落地的关键
146 3
大模型与其他业务系统打通是大模型产业落地的关键
|
机器学习/深度学习 人工智能 算法
张勇:阿里巴巴所有产品未来将接入大模型全面改造
4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得用大模型重新升级。
46497 4
张勇:阿里巴巴所有产品未来将接入大模型全面改造
|
运维 监控 Cloud Native
《生来创新-金融级云原生》——2 金融级云原生的“新标准和新蓝图”——2.2 定义金融云原生的10大新要素——要素 6:全链路技术风险防控
《生来创新-金融级云原生》——2 金融级云原生的“新标准和新蓝图”——2.2 定义金融云原生的10大新要素——要素 6:全链路技术风险防控
164 0
|
编解码 算法 安全
带你读《数据安全流通方案(瓴羊隐私计算白皮书)》——六、开源项目 mpc4j
带你读《数据安全流通方案(瓴羊隐私计算白皮书)》——六、开源项目 mpc4j
629 0
|
运维 Prometheus 监控
《2023云原生实战案例集》——01 汽车/制造——传音 基于ARMS构建全球一体化可观测平台,高效支撑业务创新
《2023云原生实战案例集》——01 汽车/制造——传音 基于ARMS构建全球一体化可观测平台,高效支撑业务创新
|
存储 运维 Prometheus
《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地
《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地
|
运维 负载均衡 监控
《2023云原生实战案例集》——01 汽车/制造——商米科技 借力ASM实现业务迭代大幅提效
《2023云原生实战案例集》——01 汽车/制造——商米科技 借力ASM实现业务迭代大幅提效