开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:客户分享:智能风控 未来已来】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/855/detail/14138
客户分享:智能风控 未来已来
内容介绍:
一、阿里云机器学习赋能
二、智能风控策略体系
三、智能风控中代表性算法
四、智能风控依靠云计算能力
五、展望未来
一、阿里云机器学习赋能
阿里巴巴集团和蚂蚁金服风控体系沉淀了许多能力,不管对特定风险识别还是对风险对象的识别,都可以一同营造真实美好的多元互联网商业和社交环境。阿里云风控服务的赋能方向就是决策引擎。在不同场景下,使用什样规则和算法产生风险决策,本身有一定复杂度,因为策略部署,运维以及后续管理等一系列问题很复杂,阿里云把阿里内部能力输出,对生态也有很大帮助,其次阿里云机器学习赋能,不管国内还国外,许多一线算法工程师写的都是数据处理代码或部署代码或胶水代码,只是标准化算法搬运工。所以可以通过机器学习平台来插件化、模块化、拖拽式来完成工作,把一线算法工程师解放出来,能够更专注于业务问题解决以及建模,尤其风控面对大量不确定性,在建模和模型评估环节需要大量时间,好的机器学习平台,就能让一线算法工程师不注重于搬运代码。
二、智能风控策略体系
智能风控策略体系,风控策略主要包括规则和算法两大部分,例如新业务会出现许多新情况,有许多业务底线要遵守,有不能承担资损,有不能容忍用户行为,所以此时需要用规则做业务兜底,而许多时候风险是突发的,如何能够快速止损,此时必然要通过有效规则来实现,因为此时做算法来不及。从特征上来说,规则许多时候就是用很强特征直接做判断和识别,而且规则依赖专家经验,也就是人对于业务的理解和对于数据的理解,算法许多时候随着业务发展,就有许多油水,此时算法更多的角色是深度的对抗,其次算法有很多细致工作要做,周期也较长。从特征上来说,算法更多时候,是强弱特征共用的过程,算法也就是人工智能。
三、智能风控中代表性算法
图神经网络学习是第一层次,小红书作为社区,有用户和笔记关系,也有用户和用户之间关系,组成了社交网络,使用吉西恩训练的时候,就自然会获取用户笔记作为点上特征,以及各种交互 interaction 之间的特征来进行学习。因为图上社区发现在风控领域也热了许多年,小红书作为社区,其中有人喜欢美妆,有人喜欢汽车,本身是天然兴趣社区,其次作为黑厂来说,有许多团伙特性出现,也可以看作是一种社区,图上社区发现背后数学原理许多都是用随机游走思想。标签传播算法,因为风控有许多经典场景,能很轻易获取黑样本或白样本,但此时数量不够。标签传播算法,可以作为经典场景,通过相似关系,把黑白样本扩充出来,获得更大黑白样本集合和需要信息。迁移学习,许多时候风控也对特定文本,或特定图像识别某种特定风险 pattern,但作为风控算法团队,很难训练 bert 或 imaginette模型,要进行迁移学习来快速识别想识别的风险 pattern。
四、智能风控依靠云计算能力
许多公司,一开始追求的是业务成功或算法成功,没有办法沉淀大后台,缺少东西的时候,如何来开始工作,例如许多新业务刚上来,本身风险积累就较少,此时就可以考虑引入云风控服务,其次想做人工智能,许多时候缺乏人工智能硬件,管理硬件平台以及如何完成模型训练,此时云上资源,云上平台是一种好的选择。尤其是键已经配妥了以后,开始要做模型和算法工作的时候,模型运维成本很高,要持续观察模型表现以及新模型文件替换流量测试,此时需要自动化平台来工作,其次还有一线算法工程师,许多时候缺乏开发能力,例如图神经网络,让一般算法工程师很难完成任务,很少有人能胜任这样的工作,只能进一步封装专业化,计算库,寻求生态圈内合作伙伴来解决问题。
五、展望未来
随着人工智能发展,智能虽然越来越强了,但还有许多重标注的任务以及随着新业务,往往伴随着新风险,专家知识依然要为风险把关,其次许多标注任务与生态有关,需要专家知识。因为风控要面对的对象很多,有图、文本、视频、关系、行为,对各个领域算法,都要有了解,都能够应用进行风控。技术上有许多东西需要攻克,随着神经网络使用越来越多,神经网络本身很容易被反帝攻击;其次还有联邦学习,生态圈中如何能更好的赋能和被赋能,联邦学习探索的方向,就不单是结果之间的赋能,其次含有大量技术要突破,例如图神经网络,每个GPU利用率较为低。风控对时间要求严,在特定时间就一定要出结果,所以提升很重要。但不管技术如何发展,决定战争胜负还是人的因素。