“开盖有奖”背后的攻防战:我卧底进500个黑产群、捡了3000个瓶盖

简介: 没想到,“开盖有奖”的活动被黑灰产、羊毛党们盯上了,不止一名消费者在网上发起投诉。

“二维码很清晰,但是无论怎么扫都扫不出来,换了好几个手机都扫不出,我怀疑是无效二维码。”

image.png

这并不是偶然事件。消费者遇到无效二维码,往往会投诉商家虚假宣传,或者怀疑饮料曾被开过,存在食品安全问题。


在这背后,存在着庞大的黑灰色产业链条。


二维码可能从生产、传输、喷印、激活等环节流出,在消费者开瓶扫码之前,羊毛党就已经从非法途径购买了批量的二维码。掏出手机一扫,红包应声落入口袋。以广东某知名饮料厂为例,羊毛党最嚣张的时候,薅走的金额高达千万。


饮料商也曾尝试解决二维码泄漏的问题。譬如,在生产、印刷环节加装摄像头,加强对员工的管理,对扫码次数进行限制,对非正常用户加黑名单,禁止再次扫码……


那时该饮料商已花费2亿,投入百来号人力,自建了一套风控系统,试图阻止黑灰产的集体盗刷行为,但效果都不尽如人意。



1、

与规模上百亿的黑灰产作战

就藏在小小的瓶盖里

2021年的夏天,该饮料商找到了蚂蚁集团的晓菱(化名),讲述了这些年被黑灰产盯上、损失上亿的情况。“你们或许是我的最后一根救命稻草!”他们希望让红包回到真正的消费者手里。


为了了解黑灰产具体是如何运转的,晓菱化身黑产一员,卧底进了500多个羊毛党聚集的聊天群,付费听他们讲薅羊毛的课程、参加活动,了解甚至购买他们用来自动扫码兑奖的“扫码机器人”。


经过分析,问题的症结浮出水面:羊毛党与真实消费者扫码行为最明显的区别,是“码”所在的地方。羊毛党扫的码,是光秃秃地显示在电脑、手机屏幕上,或者打印在纸上,而消费者扫的,是印在真实的瓶盖上、刮刮卡上的码。

image.png

晓菱说,她需要一双眼睛——只要能“看”到这个码,知道“码在何处”,真假消费者的辨别也就不成问题。


这双眼睛说的是“AI视觉反欺诈模型”。开发者是蚂蚁的AI视觉算法工程师归海和他的同事们。


这是一支由视觉算法工程师组成的团队,基本每一年都有五六篇论文发表在核心期刊和顶级会议上。3年之前,他们就筹备建立了图像感知技术平台,和图像处理有关的先进算法被集合到里面。


“现在已经优化到,点一个按钮就可以实现功能。”归海展示道。在半天时间内,归海就把初代的AI视觉反欺诈模型搭建了起来。


蚂蚁在视觉算法领域上早有积累。平台经历了数次迭代升级,业务处理的难度也降低了。从辨别证件的真假,到识别宠物鼻子的纹路确定主人,再到遥感观测千里之外树木的生长都不成问题。蚂蚁集团技术团队曾在国际计算机视觉大会ICCV2021组织的Occluded Video Instance Segmentation(简称OVIS,遮挡视频实例分割”)比赛中荣获第一。

image.png

image.png

2、

在0.1秒内

AI的“眼睛”能识别出真假消费者


归海打开晓菱发来的文件,文件夹里密密麻麻都是印着二维码的瓶盖。


这是晓菱和团队的同学花一周时间从饭店、烧烤摊上收集来的,她还发动了父母、姐姐姐夫和舅舅舅妈。有一天下着大雨,晓菱挨家挨户地向火锅店收集瓶盖。对方狐疑地问,“你是收破烂的还是骗子啊?”


在输入3000个瓶盖样本后,不到0.1秒,AI模型就辨识出哪些来自真实的消费者,可兑奖成功;哪些存疑,怀疑是羊毛党在操作,要求重新扫码兑奖,进行再次确认。


“这还不够。”晓菱说,如果变换拍摄角度,躲过手机或者电脑的边框,就有可能骗过AI模型。


于是,他们引入无监督异常检测技术,利用环境信息来做决策判断。又将1.2万个黑产群里出现的二维码作为反例输入系统,进行了迭代升级。


接下来,晓菱与负责红蓝对抗的同学协作,模拟黑产的行为,对AI视觉反欺诈模型展开攻击,归海团队的成员则在防守中不断迭代升级。


系统在2021年10月上线,饮料商客服原本潮涌般的投诉迅速销声匿迹。


但,这不过是个开始。

image.png

3、

8月迭代100多代

由无数个抵抗黑产攻击的深夜组成


在高达百亿的利润面前,黑产也在不断进化。


晓菱卧底在黑产群里,发现他们由最初的扫描屏幕,进化成了用袜子遮挡拼接的二维码的边缘,后来,又将二维码PS到瓶盖上。


最初归海只要肉眼一扫就知道问题在哪。到后来,得把存疑的部分放大几倍,去寻找它与真实扫码情况之间的细微差距,再告诉AI。


image.png

攻击时常发生在凌晨。趁着休息时间,黑灰产往往几小时就能造成商家数以万计的损失。而蚂蚁的技术团队也悄悄守在夜里,晓菱每一次的深夜提问,都有归海和同事在线上给出回应。


这是归海第一次直面黑产,他与晓菱迅速建立起默契。晓菱的工作之一是标记图片,“一个人吭哧吭哧地给存疑部分打标,一天七八千张。”


归海问,“还差多少?”


“还差4000。”


“那你给我2000。”


在一起打标的过程里,讨论随即展开。当黑产使用的手机性能足够好,在视觉上就看不到摩尔纹,两个人又从图片轮廓上寻找可能性;二维码被ps到不同背景上,归海开始琢磨新的分析方法——以二维码为中心向外拓展,寻找羊毛党在二维码周围动的手脚。


晓菱说,归海时常让她觉得柳暗花明。每当看到新的问题,归海和团队的伙伴们都能想出新点子:“这个技术是不是可以试试?”


旷日持久的攻防战里,AI视觉算法技术也日渐强大,黑产变化出的新手段,都会被迅速堵上,图像伪造的特征被逐渐细化,比如拍摄电子屏照片独有的“摩尔纹”,PS的痕迹,都被纳入系统检测范围里。


从去年到现在,AI视觉反欺诈模型在8个月里迭代100多代,准确率高达99.3%,逐渐成为一套完善的风控系统,集合了多模态、多维度的分析手法,晓菱和归海为此申请了两项专利。


“把羊毛党加入黑名单是1.0时代,引入规则判断是2.0时代,而基于图像伪造技术的风控方案就是3.0时代,”晓菱总结道。


如今,随着技术完善和成熟,晓菱和归海也不必时时保持紧张。他们下一步的计划,是让平台实现自动化。这让AI视觉算法工程师不必时时训练机器,AI可以自动化挑选问题图片,自行学习。


如今,平台继续投入与黑产的战斗,红包开始回到消费者手里,晓菱和归海的目光看到了更远的地方。他们说,对于那些涉黄、涉赌和诈骗的二维码,平台依然可以发挥作用,提取视角周边的文字和图片信息,让使用者免于受骗。


同样的技术能力也可以用在卫星系统对遥感影像的理解上。当卫星从空中拍摄农作物的图片,系统随即给出分析结果,作物的种类、长势和收成预判——即便是和自然林木相接近的果树,系统也可以给出答案。

image.png

而这位掌握了地形、降水、积温和历史产量等知识的“信贷员”,将根据作物的情况给出判断——传统信贷员都难以完成的工作将由它代劳,农民也可以更方便地申请贷款。


除此之外,晓菱和归海共同期待着,随着AI视觉算法技术变得更加智能,更多的技术领域还等着他们去探索。

相关文章
AutoJs Pro 7.0.4-1 实战教程 ---火热持续更新中
AutoJs Pro 7.0.4-1 实战教程 ---火热持续更新中
1152 0
|
BI
运营必备 - CPA、CPS、CPC、CPM推广是什么意思?(一)
运营必备 - CPA、CPS、CPC、CPM推广是什么意思?(一)
23783 0
运营必备 - CPA、CPS、CPC、CPM推广是什么意思?(一)
|
自然语言处理 并行计算 PyTorch
GitHub 开源神器 Bark模型,让文本转语音更简单!
GitHub 开源神器 Bark模型,让文本转语音更简单!
684 0
|
7月前
|
存储 SQL 关系型数据库
RDS DuckDB技术解析一:当 MySQL遇见列式存储引擎
RDS MySQL DuckDB分析实例以​列式存储与向量化计算​为核心,实现​复杂分析查询性能百倍跃升​,为企业在海量数据规模场景下提供​实时分析能力​,加速企业数据驱动型决策效能。​​
|
搜索推荐 API 开发者
京东商品详情优惠券API接口全攻略
京东商品详情优惠券API接口为电商开发者和商家提供了精准查询、获取详细信息及实时监测优惠券状态的功能。通过商品ID,可筛选出特定商品的定向或店铺通用优惠券,获取面额、使用门槛、领取条件等详尽信息,并监测优惠券的领取情况。该接口支持多种筛选参数,满足个性化需求,助力电商业务拓展与创新。示例代码展示了如何使用Python调用此接口,实现优惠券信息的高效获取。
982 23
|
7月前
|
API 数据处理 索引
电商API详解
本内容介绍了主流开放API的电商平台及其可获取的数据类型,如用户、商品、店铺及交易信息等,支持智能选品、极速上架、高效定价等功能。同时详解了API调用步骤,并提供电商应用开发指导。
|
前端开发
你不知道的css——4. 基线、中线、x-height、单位ex(含文本与图标对齐技巧)
你不知道的css——4. 基线、中线、x-height、单位ex(含文本与图标对齐技巧)
389 2
|
开发框架 前端开发 JavaScript
推荐5款热门的Web前端开发框架,助你快速构建优秀网站
推荐5款热门的Web前端开发框架,助你快速构建优秀网站
1925 1
推荐5款热门的Web前端开发框架,助你快速构建优秀网站
|
网络协议
逆向学习网络篇:通过Socket建立连接并传输数据
逆向学习网络篇:通过Socket建立连接并传输数据
360 0