“二维码很清晰,但是无论怎么扫都扫不出来,换了好几个手机都扫不出,我怀疑是无效二维码。”
这并不是偶然事件。消费者遇到无效二维码,往往会投诉商家虚假宣传,或者怀疑饮料曾被开过,存在食品安全问题。
在这背后,存在着庞大的黑灰色产业链条。
二维码可能从生产、传输、喷印、激活等环节流出,在消费者开瓶扫码之前,羊毛党就已经从非法途径购买了批量的二维码。掏出手机一扫,红包应声落入口袋。以广东某知名饮料厂为例,羊毛党最嚣张的时候,薅走的金额高达千万。
饮料商也曾尝试解决二维码泄漏的问题。譬如,在生产、印刷环节加装摄像头,加强对员工的管理,对扫码次数进行限制,对非正常用户加黑名单,禁止再次扫码……
那时该饮料商已花费2亿,投入百来号人力,自建了一套风控系统,试图阻止黑灰产的集体盗刷行为,但效果都不尽如人意。
1、
与规模上百亿的黑灰产作战
就藏在小小的瓶盖里
2021年的夏天,该饮料商找到了蚂蚁集团的晓菱(化名),讲述了这些年被黑灰产盯上、损失上亿的情况。“你们或许是我的最后一根救命稻草!”他们希望让红包回到真正的消费者手里。
为了了解黑灰产具体是如何运转的,晓菱化身黑产一员,卧底进了500多个羊毛党聚集的聊天群,付费听他们讲薅羊毛的课程、参加活动,了解甚至购买他们用来自动扫码兑奖的“扫码机器人”。
经过分析,问题的症结浮出水面:羊毛党与真实消费者扫码行为最明显的区别,是“码”所在的地方。羊毛党扫的码,是光秃秃地显示在电脑、手机屏幕上,或者打印在纸上,而消费者扫的,是印在真实的瓶盖上、刮刮卡上的码。
晓菱说,她需要一双眼睛——只要能“看”到这个码,知道“码在何处”,真假消费者的辨别也就不成问题。
这双眼睛说的是“AI视觉反欺诈模型”。开发者是蚂蚁的AI视觉算法工程师归海和他的同事们。
这是一支由视觉算法工程师组成的团队,基本每一年都有五六篇论文发表在核心期刊和顶级会议上。3年之前,他们就筹备建立了图像感知技术平台,和图像处理有关的先进算法被集合到里面。
“现在已经优化到,点一个按钮就可以实现功能。”归海展示道。在半天时间内,归海就把初代的AI视觉反欺诈模型搭建了起来。
蚂蚁在视觉算法领域上早有积累。该平台经历了数次迭代升级,业务处理的难度也降低了。从辨别证件的真假,到识别宠物鼻子的纹路确定主人,再到遥感观测千里之外树木的生长都不成问题。蚂蚁集团技术团队曾在国际计算机视觉大会ICCV2021组织的Occluded Video Instance Segmentation(简称OVIS,遮挡视频实例分割”)比赛中荣获第一。
2、
在0.1秒内
AI的“眼睛”能识别出真假消费者
归海打开晓菱发来的文件,文件夹里密密麻麻都是印着二维码的瓶盖。
这是晓菱和团队的同学花一周时间从饭店、烧烤摊上收集来的,她还发动了父母、姐姐姐夫和舅舅舅妈。有一天下着大雨,晓菱挨家挨户地向火锅店收集瓶盖。对方狐疑地问,“你是收破烂的还是骗子啊?”
在输入3000个瓶盖样本后,不到0.1秒,AI模型就辨识出哪些来自真实的消费者,可兑奖成功;哪些存疑,怀疑是羊毛党在操作,要求重新扫码兑奖,进行再次确认。
“这还不够。”晓菱说,如果变换拍摄角度,躲过手机或者电脑的边框,就有可能骗过AI模型。
于是,他们引入无监督异常检测技术,利用环境信息来做决策判断。又将1.2万个黑产群里出现的二维码作为反例输入系统,进行了迭代升级。
接下来,晓菱与负责红蓝对抗的同学协作,模拟黑产的行为,对AI视觉反欺诈模型展开攻击,归海团队的成员则在防守中不断迭代升级。
系统在2021年10月上线,饮料商客服原本潮涌般的投诉迅速销声匿迹。
但,这不过是个开始。
3、
8月迭代100多代
由无数个抵抗黑产攻击的深夜组成
在高达百亿的利润面前,黑产也在不断进化。
晓菱卧底在黑产群里,发现他们由最初的扫描屏幕,进化成了用袜子遮挡拼接的二维码的边缘,后来,又将二维码PS到瓶盖上。
最初归海只要肉眼一扫就知道问题在哪。到后来,得把存疑的部分放大几倍,去寻找它与真实扫码情况之间的细微差距,再告诉AI。
攻击时常发生在凌晨。趁着休息时间,黑灰产往往几小时就能造成商家数以万计的损失。而蚂蚁的技术团队也悄悄守在夜里,晓菱每一次的深夜提问,都有归海和同事在线上给出回应。
这是归海第一次直面黑产,他与晓菱迅速建立起默契。晓菱的工作之一是标记图片,“一个人吭哧吭哧地给存疑部分打标,一天七八千张。”
归海问,“还差多少?”
“还差4000。”
“那你给我2000。”
在一起打标的过程里,讨论随即展开。当黑产使用的手机性能足够好,在视觉上就看不到摩尔纹,两个人又从图片轮廓上寻找可能性;二维码被ps到不同背景上,归海开始琢磨新的分析方法——以二维码为中心向外拓展,寻找羊毛党在二维码周围动的手脚。
晓菱说,归海时常让她觉得柳暗花明。每当看到新的问题,归海和团队的伙伴们都能想出新点子:“这个技术是不是可以试试?”
旷日持久的攻防战里,AI视觉算法技术也日渐强大,黑产变化出的新手段,都会被迅速堵上,图像伪造的特征被逐渐细化,比如拍摄电子屏照片独有的“摩尔纹”,PS的痕迹,都被纳入系统检测范围里。
从去年到现在,AI视觉反欺诈模型在8个月里迭代100多代,准确率高达99.3%,逐渐成为一套完善的风控系统,集合了多模态、多维度的分析手法,晓菱和归海为此申请了两项专利。
“把羊毛党加入黑名单是1.0时代,引入规则判断是2.0时代,而基于图像伪造技术的风控方案就是3.0时代,”晓菱总结道。
如今,随着技术完善和成熟,晓菱和归海也不必时时保持紧张。他们下一步的计划,是让平台实现自动化。这让AI视觉算法工程师不必时时训练机器,AI可以自动化挑选问题图片,自行学习。
如今,平台继续投入与黑产的战斗,红包开始回到消费者手里,晓菱和归海的目光看到了更远的地方。他们说,对于那些涉黄、涉赌和诈骗的二维码,平台依然可以发挥作用,提取视角周边的文字和图片信息,让使用者免于受骗。
同样的技术能力也可以用在卫星系统对遥感影像的理解上。当卫星从空中拍摄农作物的图片,系统随即给出分析结果,作物的种类、长势和收成预判——即便是和自然林木相接近的果树,系统也可以给出答案。
而这位掌握了地形、降水、积温和历史产量等知识的“信贷员”,将根据作物的情况给出判断——传统信贷员都难以完成的工作将由它代劳,农民也可以更方便地申请贷款。
除此之外,晓菱和归海共同期待着,随着AI视觉算法技术变得更加智能,更多的技术领域还等着他们去探索。