网络安全:步入与AI结合新时代
在 2020 支付宝合作伙伴大会上,已有 12 亿用户的支付宝宣布转型数字生活开放平台。海量用户,还要对外开放,在这背后,需要极强的安全风控能力。但一般人不知道的是,如此重大艰巨的任务背后,也有着历届应届生的功劳。
应届生如何参与支付宝安全风控的核心研发?我们找到了支付宝安全部门的资深技术专家王维强,请他给我们做一下介绍。
支付宝安全团队的数据大牛们
随着时代发展,业务安全风控逐渐走入人工智能时代,支付宝安全团队就招募了几位 Kaggle Grandmaster。
Kaggle 是安东尼·高德布卢姆(Anthony Goldbloom)2010 年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了超过 100 万名数据科学家的关注,可以说是数据科学行业最大的交流平台。
Kaggle Grandmaster 是在 Kaggle Competitions 平台上举办的比赛中,连续取得非常优异的成绩才会获得的头衔,可以说是数据科学方面万里挑一的顶级高手。目前,Kaggle 只有 180 位 Grandmaster。
支付宝安全团队近几年陆续招募了三位 Kaggle Grandmaster,他们的强项各不一样,有的擅长对结构化数据进行特征挖掘,有的对图像检测识别非常精通,还有的对 NLP、深度文本挖掘方面很有研究。
崔世文就是其中的一位,在 2019 年,他和蚂蚁的其它几个小伙伴们组队,利用业余时间在 KDD Cup 2019 Regular ML Track 全球竞赛中获得冠军,这项比赛被誉为数据挖掘界的奥林匹克。
除此之外,团队在过去两年的蚂蚁数据挖掘内部赛中连续获得冠军。也更是在专业赛道比如 CCL 2019 中国法研杯比赛,获得了总分第一。
说起如何找到这些高手,王维强直言是机缘巧合。原来团队里有同学在 Kaggle平台上参加比赛交流,通过选手之间的交流知道了圈内的牛人,而支付宝安全团队也刚好需要这个领域的高手加入,于是伸出了橄榄枝。
对于这些数据大牛来说,选择是双向的,他们并不缺乏工作机会,但很多人希望能够有一个较好的平台能够一展所长,或者身边有牛人可以互相交流学习。
支付宝安全团队的业务非常有挑战性,团队拥有数据科学领域各个方面的人才,横向学习的氛围很浓。也正是这些原因,让这些大牛心甘情愿的加入团队。其中还有一位同学拒掉了外部的高薪 offer 来到蚂蚁,因为短期利益不如长期价值。
另外,他们也认可支付宝安全团队所做的事情,认可支付宝对于用户和社会的价值,认同支付宝做事情简单的价值观,跟一群有情有义的人去做一些有意义的事情。
做安全为何要这么多数据人才
支付宝安全团队需要保护 12 亿用户的账户和资金安全,责任重大,那么他们具体需要做哪些事情呢?
业务上来讲,安全团队需要负责建设和维护支付宝账号体系、资金交易、商家服务的一整套业务安全防控机制。比如用户的账号是不是被盗了,某笔交易是不是被诈骗了,交易是否用于违规违禁用途如赌博等,还有如商家行为违反监管规定等,这些都会对支付宝的用户和资金造成风险,这些风险的管控就是大安全所做的事情。
在与黑产和羊毛党对抗的过程中,双方的技术都在不断升级,业务安全风控也必须应用最新的技术。随着机器学习开始在数据科学领域大放异彩,做安全的同学也开始利用人工智能来保护业务安全。
具体的手段包括,通过机器学习的算法和模型、与安全策略一起,通过数据挖掘来做风险识别和风险管控,另外也会会涉及到决策优化。
这里面的技术包括数据挖掘、机器学习、决策优化等等。机器学习很广泛,像里边的集成树模型,深度学习中的深度文本挖掘,图像识别,运筹优化,强化学习,对抗机器学习等,在支付宝的安全风控中都会使用到。
至于未来安全风控领域未来的技术趋势,王维强目前比较关注这些方向:模型可解释性,知识推理、图计算、决策优化等。首先模型可解释性,机器学习算法在业务安全落地对可解释性要求是非常高的,完全黑盒的模型可能造成不可预料的后果,这在业务安全上不可接受;其次是知识推理,前些年的机器学习通过学习做判断或预测,但推理比较少,从学习到推理是人工智能下一步的方向;然后是图计算,过去在解决业务问题时,对关系的描述还是靠人工经验,做安全需要对关系进行精细化刻画,因为需要在上亿的用户里和极少数黑产进行对抗;最后则是决策优化,这说的是更好的平衡用户的风险和安全感体验,避免只强调安全而破坏用户的体验,而这里面要做到一个什么样的程度,就是决策优化需要做的事情,对一个决策来说需要从很多角度去平衡。
总体上来讲,业务安全风控的未来将会更智能化。一方面在基础技术上,人工智能需要从学习到推理,再发展到强人工智能,才能应对更多更复杂的场景;另一方面,在安全风控场景中,我们需要更精准的去描绘更复杂的关系,从而更好的调整和应对,而这离不开 AI 的助力。
安全团队需要什么样的应届生
除了上面那些竞赛大牛外,还有不少校招应届生在支付宝安全团队大展拳脚。
比如,算法工程师王宝坤就是校招进来的,他来自复旦大学,2018 年硕士毕业后加入团队。他负责的是图计算、图表征等比较前沿的方向,因为在大学的实验室里也是做这个方向,所以积累很深,加入团队后很快的理解业务,主动提议用图计算做团伙挖掘的场景,并取得了很好的成果。
王维强介绍说,他们希望招募到研究型 + 业务型的综合性人才。一方面,希望新人在机器学习和大数据分析等方面有比较深入的技术积累,对技术吃的比较透,因为团队做的是没人做过的事情,在业界也属于前沿,所以没有参考,不能套用别人的方案,别人的算法也不能拿来就用,必须要根据业务做相应的创新,而这只有对技术十分了解才能做到。
另一方面,因为安全团队是业务部门里的技术团队,市场形势复杂多变,业务也随之而快速变化,只有非常快的消化技术并理解业务,才能找到风险类型的算法落地的方案,然后把这些新的技术落地到业务里,才能拿到结果。
因此,在校生如果今后想从事业务安全风控行业的话,建议深钻技术,在掌握学校里的技术基础课程的同时,也可以去了解当前大数据和机器学习的主流和前沿技术。在实习或者做项目时,要多问几个为什么,一方面通过了解项目背景从而更好的理解业务,另一方面了解所使用的技术背后的原理,而不是知其然而不知所以然。