隐语发布“基于MPC的金融风控全链路技术方案”

简介: 隐语发布“基于MPC的金融风控全链路技术方案”


收录于合集#应用案例3个

过去几年,业界不断推进隐私计算在金融场景的实践探索。其中,多方安全计算(MPC)技术可实现对原始数据按用途授权使用,有效避免数据的二次流转,达到数据“可用并可控”相对更匹配金融行业的联合风控场景需求。多方安全计算技术在金融风控的贷前准入、贷中提额、贷后清退、金融反欺诈等场景中都有着巨大的应用价值,隐语开放平台此次发布的技术方案之所选择MPC路线深度打造,既是因其安全性上可证的优势,也是为金融风控量体裁衣,助力提升金融风控数据价值共享的安全水位,并对金融机构展示出MPC方案的通用性灵活性,降低整个金融行业数智升级改造成本、提升新安全协议业务接入效率。11月18日下午,蚂蚁集团隐私智能技术部总经理、隐语开源框架负责人王磊于2022年第五届中国金融科技产业峰会「金融安全与密码应用」论坛,发布了隐语——基于MPC的金融风控全链路技术方案”,本篇将展开各个环节具体内容及背后的技术支撑,进行详解。


01


与已有金融风控隐私计算差异何在?

金融风控的细分链路往往长而繁,每个环节都会面临数据安全的挑战,而为全链路提供高安全水位的MPC解决方案难度极高。此前,业界对全流程金融智能风控的研究还处在探索阶段,暂无公开的基于MPC的金融风控全链路解决方案。因为,训练风控模型只是金融风控的其中一环。在建模之前,往往还会涉及数据的探查、数据的加工与分析,在建模之后,还需要将模型服务化。对于隐私计算来说,无论是前期的数据分析、或是后期的模型服务所带来的难度,都不低于机器学习,甚至在MPC的数据分析领域的难度更超过了MPC机器学习。隐语能够实现此方案,一方面基于自身在MPC技术上的积累与研创,另一方面依托蚂蚁丰富的金融行业场景打磨沉淀,通过多年的创新、应用组合训练,才得以针对金融风控数据全生命周期高安全性的需求,实现了包括数据分析、特征预处理、模型训练、效果评估、模型服务化在内的全链路安全的数据处理能力,为多方数据合作场景提供了金融风控的全链路技术解决方案。

02


隐语MPC金融风控业务视角背后的技术详解

通过隐语开放平台体验金融风控中的必经业务步骤,可以分别找到其背后基于MPC的全链路技术支撑点。体验申请地址:https://survey.alipay.com/apps/zhiliao/FdC-vTsPM

1、数据注册

在数据资产注册环节,隐语即提供了独有的CCL(Column Control List)列安全约束功能,以应对后续所有环节中的数据安全隐患。该功能可支持联合项目的所有参与方在数据注册阶段,各自配置其数据资产的安全约束;在用户创建项目后,任何对数据的使用都会触发系统自动检查,确保后续所有操作都满足用户配置的安全约束。

2、样本对齐

隐语提供隐私安全求交PSI能力,在多方样本对齐处理过程中,保证样本交集外的无关数据不泄露。且在这一环节中,用户可根据多方样本的交集拼上多方特征,形成虚拟宽表用于后续的建模。

3、特征预处理

隐语提供了丰富的特征预处理组件,可满足用户进行空缺值/异常值处理、数据标准化、woe分箱等联合特征处理,配合特征统计组件如相关系数矩阵、全表统计、VIF指标计算,即可辅助用户完成多方安全数据分析的统计结果生成。

4、模型训练

隐语在隐私计算算法层面建设了一系列的通用机器学习算法,如逻辑回归、评分卡、XGB等算法,且平台提供了通用的组件配置项,业务可根据实际数据情况进行模型的选择和配置,按需应用于在金融风控贷前、贷中、贷后及反欺诈等场景。

5、模型预测

隐语支持模型服务化一键提交部署,提供测试环境验证、冒烟、灰度、重跑等一系列稳定性保障措施,确保性能达到生产级别。

6、监控和审计

针对模型上线服务,隐语提供了一系列业务指标监控能力,支持机器维度资源监控的同时,也能监控识别模型效果,在部分指标下降或出现异常数据时,可进行服务版本的升级;同时,平台提供了全链路审计的能力,所有平台操作和运行日志都可追溯、可审计,以进行多方安全模型迭代或问题排查。

目前,上述流程已可通过隐语开放平台进行体验,并且提供多种安全协议可供选择,可根据不同的业务场景选择不同的安全协议,达到安全、效率、效果的平衡。隐语开放平台已开放体验申请,欢迎申请试用!

03


隐语MPC金融风控全链路技术方案展望

金融风控全链路方案在保护数据源头方信息不泄露的前提下,可将更多维度信用数据纳入联合模型中,从而构建更精准的大数据信用风控模型。该技术方案的支持,可增进金融风控联合项目参与方彼此之间必要的协同与沟通,加速金融风控管理模式由传统手段向前沿技术的转型,服务于政府与金融业协同监管,更好地促进金融数据要素市场的建设。隐语未来的MPC全链路技术方案建设不仅针对金融风控,未来也将开放NN、DeepFM等营销推荐中常用的模型,与隐语的多方安全分析能力结合,逐步开放医疗、营销等更多场景的全链路方案,隐语开放平台还将在那时通过提供DAG行业建模模板、IDE代码模版,以便真切感受隐语的MPC全链路能力。此外,隐语开源框架V0.7.11代码也已发布,开发者可以调用代码进行定制化开发除本篇隐语开放平台功能详解,隐语开源社区也将面向开发者发布配套的交互式教程,敬请期待!

相关文章
|
人工智能 自然语言处理 安全
从 ChatGPT 到 AI 大模型私有化部署,为什么企业需要私有化专属大模型?
目前,大模型已经能够切实的影响到我们每个人的工作、学习、生活,赋能千行万业,但是开放的大模型却无法很好的适应企业或单位的内部需要,为此,此处研究并提出为什么企业需要私有化大模型,并探讨私有化大模型的优势和挑战,同时本文也举出了一些实践落地的例子,希望能给读者带来一些思考和启发。
|
算法 搜索推荐 数据挖掘
AB实验设计
AB实验的原理、优缺点及流程
2116 0
AB实验设计
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大模型(LLM)从入门到精通:测试人的技术跃迁指南
大模型正快速融入测试全流程——从用例生成、脚本编写到日志分析。本文用实战视角带你搞懂LLM核心原理、落地场景与避坑指南,手把手教你从“会用”进阶到“会赋能”,做那个驾驭AI的超级测试工程师。
|
机器学习/深度学习 SQL 人工智能
隐私计算框架“隐语”介绍及展望(附ppt)
隐私计算框架“隐语”介绍及展望(附ppt)
1249 0
|
监控 安全 算法
云上智能风控:构建金融安全的智能防线
云上智能风控系统具有良好的灵活性和可扩展性。随着金融市场的不断变化和技术的不断发展,系统能够灵活调整风控策略和算法模型以适应新的风险类型和场景。同时,系统还能够根据业务需求进行功能扩展和升级以满足不同金融机构的个性化需求。
1147 7
|
运维 监控 Linux
解决CPU与带宽高使用率问题:深入分析与应对策略
引言:性能问题的诊断与优化 在运维工作中,操作系统性能问题如影随形,典型代表是CPU使用率高和带宽使用率高的问题,它们直接影响应用的性能和响应时间。这篇记录将逐个分析这两个问题的产生原因和解决方法。
解决CPU与带宽高使用率问题:深入分析与应对策略
|
安全 开发工具 虚拟化
使用 VMware + win10 + VirtualKD + windbg 从零搭建双机内核调试环境
使用 VMware + win10 + VirtualKD + windbg 从零搭建双机内核调试环境
|
机器学习/深度学习 SQL 人工智能
隐私计算技术路线介绍及对比
隐私计算技术路线介绍及对比
1817 0
|
关系型数据库 MySQL 数据库
Python中 mysql.connector.pooling的8小时超时问题
背景 工作中一个Python项目中在连接mysql 时使用mysql.connector.pooling,实际使用中发现个别的数据库一段时间后连接全部断开没有任何的预兆和错误。后来发现是由于mysql的8小时超时问题 关于mysql.
2120 0
|
弹性计算 大数据 测试技术
阿里云4核16G服务器价格多少钱?2024年4核16G阿里云服务器报价及测评
阿里云4核16G服务器价格多少钱?2024年4核16G阿里云服务器报价及测评。阿里云4核16G服务器的价格会根据不同的实例类型和促销活动有所不同。在2024年的价格表中,4核16G的服务器价格有两种说法。一种是作为云服务器ECS的配置,其价格为26元/月或149元/半年。另一种是作为游戏服务器的配置,其价格为26元/月。对于性能评测,4核16G的服务器配置可以提供较高的计算能力和内存容量,适用于处理大型应用和复杂计算任务。无论是网站、应用还是游戏服务器,这种配置都可以提供流畅、稳定的运行体验。
522 0