AB Test如何应用于风控场景?

简介: AB Test是一个很好的导航系统和说理工具,策略分析师在各个场景使用这种分析方法,可以形成一个完整的闭环;本文作者分享了关于AB Test如何应用于风控场景,我们一起来看一下。

一、A/B Test 概念

什么是AB Test?

1)我们先通过一张图来了解系统的概念,做一做铺垫:系统,就是将多个输入转化成输出的中间过程(图中的输入,也称为变量)。ps:有数学背景的同学,可以把系统理解成一个多元函数y=f(x1,x2,x3)。

2)然后基于系统图导出控制变量法

由于影响系统输出的输入变量有多个,如果我们需要考察其中某一个输入变量(比如输入1)对系统输出的影响时;我们需要在保持输入2和输入3不变的前提下,改变输入1,然后观察输出的变化,从而确定输入1对输出的影响;这就是控制变量法,核心是控制其他变量不变,排除其交叉影响,单独观察某一个变量对结果的影响。

3)再基于控制变量法引出对照组的概念

当我们保持输入2和输入3不变,单独改变输入1时,我们需要在样本中确定有多大比例的样本(不)需要改变输入1,由此按比例随机抽样、从而形成两个相互对比的样本(改变输入1的一般称为实验组,不改变输入1的称为对照组)。

4)最后回到我们的核心概念AB Test

AB test就是通过随机抽样设置对照组和实验组,A是对照组,B是实验组,AB两组占比由实际场景决定(任意一组的占比一般不能太低,要满足统计学意义),加起来是100%。

由于是随机抽样,AB两组一开始是完全相同的样本;然后,改变一个变量,使得B相对A来说只有一个变量不同,从而可以将该变量单独拎出来、观察它对输出结果的影响:

对照组方法,是科学研究中用途极广的方法,有着坚实的统计学理论支撑;产品部门经常用到对照组方法,产品部一般称为AB Test,这种叫法比较通用,为方便交流,本文采用此种叫法;风控部门也经常用到对照组方法,一般称为“冠军挑战者”。

二、A/B Test 适用场景

以下我们针对常用的几个场景,给出基于AB test的解决方案,给大家展示AB test在风控中的典型应用场景、应用方式及其效果,希望大家能够举一反三,在自己的工作中能用上。

AB test方法应用灵活、基于实际场景千变万化,也有一些需要避免的问题,整个AB test机制包括需求分析、机制设计、数据分析、策略调整等,是一个完整的闭环。

场景一:无法确定策略调整的效果,找不到策略调整的方向

问题剖析:评估策略效果的指标大家都很明确,而无法明确效果,究其原因,是因为影响风控指标的输入变量有多个,包括客群质量、时间、风险策略等;而策略只是其中的一个变量,调整策略变量的同时,其他变量可能同时发生改变,因此无法确切评估策略的调整对风控指标的影响。至于策略的调整方向,AB两套策略的差异点你是完全知道的,这个差异是造成最终逾期率不同的唯一原因,找到其中大头的差异点,就是本次调整的方向。

场景二:已经明确要调整的具体规则,目前有多个方案,无法确认哪个方案最优

问题剖析:已经知道要收紧的具体的规则了,但是有多种收紧方案,在策略流程上,是前紧,还是前松后紧,着实让人无法抉择;因为在风险策略人员的视野里,不仅仅只有通过率、逾期指标;还有征信成本、数据信息量等其它纬度的考量因素。

解决方案:直接对确定调整的规则进行A/B Test 即可。

总结一下,策略的AB test机制,是一个很好的导航系统和说理工具,作为导航系统,它让策略人员在调整策略的时候,知道自己的方向,因此明明白白;作为说理工具,它让策略人员在展示自身工作对全局影响的时候,听众心服口服。


天眼数聚api接口大全以大数据为基础,覆盖人脸身份核实、运营商、银行卡、车辆、医疗、智能识别等,为企业用户提供多维度、全方位的数据API服务;目前已服务近万家企业,涵盖了教育、游戏、电商、物流、金融、保险、支付、出行等数十个领域,同时公司在数据采集、模型算法、机器学习等领域具有较强的技术优势,所推出的基于业界领先算法模型的活体检测、人脸身份证识别接口等智能识别服务广受好评。

相关文章
|
定位技术 索引
基于Amos路径分析的输出结果参数详解
基于Amos路径分析的输出结果参数详解
2281 2
|
2月前
|
存储 人工智能 API
部署 OpenClaw 双层记忆系统实战:Mem0+Qdrant向量检索+Markdown持久化搭建教程
在AI智能体实际使用中,**记忆能力**直接决定体验上限。传统上下文窗口有限、历史对话易丢失、关键信息无法长期留存,导致每次交互都要重复说明需求。OpenClaw结合Mem0与Qdrant构建的**双层记忆体系**,完美解决这一问题:上层基于向量数据库实现语义检索与长期记忆,下层通过Markdown文件做关键数据持久化备份,兼顾检索效率与数据安全。
894 5
|
机器学习/深度学习 人工智能 编解码
【AI系统】轻量级CNN模型新进展
本文继续探讨CNN模型的小型化,涵盖ESPNet、FBNet、EfficientNet和GhostNet系列。ESPNet系列通过高效空间金字塔卷积减少运算量;FBNet系列采用基于NAS的轻量化网络设计;EfficientNet系列通过复合缩放方法平衡网络深度、宽度和分辨率;GhostNet系列则通过Ghost模块生成更多特征图,减少计算成本。各系列均旨在提升模型效率和性能,适用于移动和边缘设备。
1279 6
|
负载均衡 Oracle 网络协议
Oracle中TAF与SCANIP全面解析
通过本文的解析,读者可以清晰地理解Oracle中TAF与SCAN IP的概念、工作原理及其在实际应用中的优势和局限性。TAF通过自动故障转移提升了会话的高可用性,而SCAN则通过简化客户端连接和负载均衡提升了集群的可管理性和扩展性。这两种技术在现代企业数据库架构中扮演着重要角色,能够显著提高系统的稳定性和可用性。
705 6
|
数据采集 运维 JavaScript
淘宝反爬虫机制的主要手段有哪些?
淘宝的反爬虫机制包括用户身份识别与验证、请求特征分析、页面内容保护、浏览器指纹识别和蜜罐技术。通过User-Agent识别、Cookie验证、账号异常检测、请求频率限制、动态页面生成、验证码机制等手段,有效防止爬虫非法抓取数据。
|
数据管理 测试技术 项目管理
CMMI—集成项目管理(IPM)
CMMI—集成项目管理(IPM)
518 0
|
存储 JavaScript 前端开发
【开发模板】Vue和SpringBoot的前后端分离开发模板(二)
【开发模板】Vue和SpringBoot的前后端分离开发模板
349 0
|
Windows
Anaconda——安装及基本使用
Anaconda——安装及基本使用
742 0
|
jenkins Java 持续交付
从0搭建属于自己的jenkins持续集成平台
Jenkins在日常工作中占据了一个非常重要的角色,帮助我们节省了大量用于构建的时间。有些公司有运维大哥对Jenkins进行维护,如果没有那只能自己动手了。俗话说的好自己动手丰衣足食,所以本文就从0开始搭建属于自己的Jenkins持续平台。主要包含,普通项目构建、流水线构建、多分支流水线构建并将构建结果辅以钉钉通知。
从0搭建属于自己的jenkins持续集成平台
|
数据采集 JSON Java
stream流式JSON数据的特点及Java示例
流式JSON数据是指将JSON数据分成小块进行传输或处理的方式。与传统的JSON数据不同,流式JSON不需要将所有数据一次性读取到内存中进行处理,而是可以在数据流中逐个读取并处理。这种方式可以有效地避免内存溢出和性能问题,同时也可以使数据传输更加高效和可靠。流式JSON数据适用于许多场景,包括大数据处理、网络传输、实时数据处理和日志处理。在这些场景中,流式JSON可以显著提高数据处理和传输的效率和可靠性。同时,流式JSON还可以帮助开发人员更好地管理和处理JSON数据,并使得处理大量JSON数据变得更加容易和高效。
1288 0