本文讲的是不谈F1的设备指纹都是耍流氓?,
在金融科技越来越重要的今天,越来越多的技术安全公司通过新金融科技,例如大数据、反欺诈和设备指纹等技术来提高互联网金融平台后端和用户数据的安全性,其中,设备指纹技术成为多家争抢的“龙旗”,那么多号称拥有设备指纹技术的公司,到底该按什么评判其技术优劣、效果好坏呢?
设备指纹技术是什么?
设备指纹就是通过在网站或者移动端嵌入前端JS脚本或SDK来采集终端用户环境的非敏感设备特征细信息,通过服务端的设备特征匹配算法而建立一套全球设备标识库,相当于为每一位互联网用户的访问设备分配了唯一的设备标识。通过设备指纹,可以更加精准的分析互联网欺诈者的行为轨迹,从蛛丝马迹中识别风险、预警风险,准确追踪定位风险产生的用户主体以及关联的所有用户。
设备指纹技术的优劣,还得F1测度说了算。
F1测度(F1 Measure),是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的精确率(P)和召回率(R)。F1分数可以看作是模型精确率(P)和召回率(R)的一种调和平均数,它的最大值是1,最小值是0。F1测度与精确率(P)、召回率(R)是正相关关系。
F1测度的数值范围为0到1,当F1测度数值越接近1时,代表该设备指纹技术越优秀。
F1测度计算公式
设备指纹技术事实上就是在解决一个记录关联匹配的问题,将来自于同一个设备的事件请求打上相同的设备指纹关联在一起。精确率(P)代表设备指纹技术判断出正样本的正确率,召回率(R)代表设备指纹技术识别正样本的覆盖率,都只是单一、片面地在评估设备指纹技术,而F1测度是精确率和召回率的综合反映。
F1测度是对设备指纹技术最合理公正客观的判断,它既不会偏向精确率,又不会偏向召回率,有的设备指纹技术一味追求精确率(P)而忽略召回率(R),即使能够做到精确100%,但是只能判断出的正样本寥寥无几,漏判了大量的正样本,没有任何意义;当然,一味追求召回率(R),也没有任何意义,这样会导致误判率上升。
以竹筛筛选绿豆为例,竹筛空隙大小影响能否准确地过滤出全部杂质;筛选之后,留在筛子的绿豆占竹筛中剩余物质的比例对应于精确率(P),留在筛子的绿豆占所有绿豆的比例,对应于召回率(R);当竹筛空隙很大时,能够筛出更多杂质,保证留下的物质基本上是绿豆,此时精确率(P)接近于1,但是召回率(R)会很小;当竹筛空隙很小时,能够留下更多的绿豆,但是也会包含大部分的杂质,此时召回率(R)接近1,而精确率(P)很小。精确率和召回率是一对矛盾,精确率大时,召回率会很小,反之,召回率大时,精确率也会很小。而F1测度,平衡了精确率和召回率。
目前,F1测度已在国际上得到广泛认可,被众多拥有设备指纹技术的公司作为评判设备指纹技术优劣的重要指标,例如知名技术服务商Drawbridge、全球最大征信机构Experian等。虽然国内市场上众多公司声称拥有设备指纹技术,最终其技术的优劣还是体现在F1测度的数值上,国内仅有为数不多的几家拥有被动式设备指纹技术的企业也在使用F1测度衡量标准。F1测度能在客户面临众多设备指纹技术公司时,作为一项最公正客观的指标衡量其优劣,筛除“流氓公司”。
原文发布时间为:2017年7月13日
本文作者:猛犸反欺诈
本文来自云栖社区合作伙伴嘶吼,了解相关信息可以关注嘶吼网站。