蚂蚁金服西亭:智能金融的技术挑战与方案

简介: 在2018年1月6日的云栖社区数据智能技术论坛上,蚂蚁金服的周俊(花名西亭)做了题为《蚂蚁金服智能金融实践》的主题演讲。目前金融场景应用的越来越多,对金融服务也提出了更多的挑战,西亭介绍了蚂蚁金服为应对挑战进行的系统性风险的预测与监控,基于用户语义和近期操作行为的智能助理以及精准营销与推荐服务等技术,此外,他还介绍了基于AI的车辆定损产品。

以下为精彩视频整理:

目前智能技术场景应用的越来越多,比如微贷,保险,支付,风控,财富等等,对金融服务也提出了更多的挑战,比如:时间敏感,海量数据,业务多样性,系统风险性,强安全,自动化等。在图像/语音、NLP、机器学习、推理与决策等领域,应用强化学习、无监督学习、图推理、迁移学习等技术,在大规模数据的情况下,期望实现快速处理和实时对抗。

深度学习+图:系统性风险预测与监控

对于用户资金的安全,需要在用户账号、设备和商户三端来进行保障。传统的风控技术是基于规则和策略来实现。随着案例增多,加的规则也越来越多,传统的模型较难符合当前的需求。蚂蚁金服是采用树模型对于非可信交易进一步判断是否账号被盗。同时采用GBDT+DNN进一步改进盗账号模型,目前提升了10%检测率。以支付宝为例,每天可以让一千多万笔交易更快更准地通过风险检查。这对系统本身、公司成本、用户安全感的提升,都非常有利。
下面介绍图学习模型的另外一个应用案例:垃圾账户识别

e751db1b95231ccef366c25b776c38254f5e290e

业务有关的网络数据,通过Structure2vec深度网络技术(Structure2vec可以根据少量的标注数据,来判断用户是好人还是坏人)对图进行向量化表征,然后根据业务特点优化目标。在用户注册时,利用用户、设备的关联去构建图,并判断账户是否为垃圾账户。这样能对垃圾账户的注册进行防控,降低后端风险基数,稳定大盘指标,极大提高整体的账户质量。与Node2Vec和规则等技术对比,Structure2vec的提升效果较明显。

02fd730a5be6eb36001395db32f491a09e2704da

在一些垃圾邮件中,有些汉字机器不能识别(比如“银行”写成“钅艮”和“彳亍”)。为了尝试解决这个问题,可利用汉字的笔画信息,将这些字拆成单一字,再拆分成笔画,利用ID来表示这些笔画,生成N元笔画信息,进而生成中文词向量。这个方法对词语有较好的识别作用,可以一定程度上处理用户输入的恶意信息,保证内容安全。

智能助理:超越人的满意度的智能客服

dca22f7394689d9d5d0c99addada01fde5f32ed0

在蚂蚁财富APP里面,用户可以点击客服机器人头像或是社区机器人,讨论或直接输入问题,与机器人对话。为了改善智能客服,针对客服机器人,结合用户行为轨迹的进行语义匹配。比如根据用户的输入“怎么申请钱退回来”,再根据用户近期的转账行为,通过深度学习去做语义匹配,可以返回用户想要知道的问题的可能答案。这个模型在2016“双十一”的自助率为 97%,客服机器人满意度超越人工客服 3个百分点;针对财富号机器人,构建基于金融领域情感知识库。通过对模板的情感单元抽取,利用情感知识库计算情感单元的正负情感得分,汇总所有情感单元的得分得到总情感得分,再加上卷积神经网络(CNN)和张量神经网络(TNN)组合,输出新闻文本的最终得分,其准确率可以达到88.4%。

基于哈希的海量特征提取:快速、高效

通过深度学习和在线学习构建了基于参数服务器的大规模机器学习框架。该框架具有数据与模型并行、鲁棒故障切换、同步和异步-迭代、支持1000亿特征、1000亿样本、10000亿参数等特点。在安全可信交易识别模型中,相同覆盖度的情况下,案件召回率从91% 增加到 98%;每天可以让一千多万笔交易更快更准地通过风险检查。在典型推荐场景中应用了大规模矩阵分解算法,该算法使用Binary Hash,而非实数向量偏好,通过可忽略的精度损失,来换取大量的预测时间及存储资源节省:1亿*1千万的矩阵分解,在2小时内收敛。在口碑猜你喜欢场景下曝光点击率(CTR)有明显提升:有头条版本点击率:2.5%->5.5左右,升幅超过120%。

深度强化学习:时序决策——营销与推荐

d2570d5ec2e84843ad02a0c5c0650693d3d0e4ba

强化学习营销需要基于实时事件场景人群定向(事件+人群+渠道),多目标(点击+签约)优化融合与在线决策。该模型的算法设计需要从多个业务抽取特征,刻画用户状态;同时对卡片和渠道做组合决策;综合用户的点击和签约行为。实时深度强化模型能实现事件(如登录)实时触发流式计算和模型调用,实时样本回流,保证线上线下特征一致性。与传统深度学习模型相比,实时深度强化模型在推荐卡片点击率提高了171%和最终签约率方面提升了149%。

一键式部署与效果监测

514eccdd2be7f548991ba53f2043d6e5659c76d0
算法贡献者编写算法并进行算法优化,算法应用开发者开发应用和部署应用,解决方案贡献者分享经验和行业方法,解决方案使用者采购方案和集成方案,把这些东西全部沉淀到模型服务平台(水晶球)里面,打造特征工程、模型训练、模型管理、业务系统等整条链路。对内支持支付、口碑等业务,对外通过开放平对外开放给企业伙伴。
模型服务平台(水晶球)具有良好的产品特性:

  • 可视化建模交互:拖拽式的流程组合,辅助式的特征设计,完备的分析评估。
  • 丰富算法接入:机器学习深度学习常规算法;图像金融等垂直领域算法;TensorFlow等开源支持。
  • 海量数据存储计算:超大规模参数服务器;具有GPU,FPGA高性能计算。
  • 全域模型资产管理:社区团队协作;特征共享,实验分享;领域知识沉淀,专家经验积累。
  • 便捷模型部署:一键从建模完成到发布;在离线特征强一致保证。
  • 高效在线预测:99.99%可用性保证;高性能浮点与矩阵运算;标准化接口可插拔算子。
  • 探索式模型演进:支持A/B测试框架;全生命周期模型效果监测;主动发现最优模型和参数。

图像定损产品“定损宝”

行业专家与算法工程师通力合作,通过全链路深度学习,融合噪音去除、目标检测、程度判断、目标分割、决策生成等,实现车辆定损。我国每年的车辆定损案件4500万,其中60% 纯外观损伤案件。案均处理成本为150元,定损宝可减少50%的作业量,同时解决偏远地区或高峰期人力不足的问题。

b26db94f5fc944f9fecf0d28188469c08a31a886


原文发布时间为:2018-01-23

本文来自云栖社区合作伙伴“中生代技术”,了解相关信息可以关注“中生代技术”微信公众号

相关文章
|
人工智能 监控 安全
智慧园区方案:AI 与视频融合技术如何助力园区监管智能化升级
随着科技的不断发展,人工智能(AI)技术正在各个领域迅速应用和推广。其中,智慧园区是一个重要的应用场景,它通过 AI 技术的支持,实现了园区的智能化管理和高效运营。
456 0
|
Cloud Native 中间件 新金融
金融先锋联盟:持续聚焦金融机构核心架构升级
金融先锋联盟:持续聚焦金融机构核心架构升级
305 0
|
Cloud Native Oracle 关系型数据库
《生来创新-金融级云原生》——引言 金融 IT 架构的发展
《生来创新-金融级云原生》——引言 金融 IT 架构的发展
176 0
|
存储 人工智能 运维
带你读《生命科学行业云上解决方案及最佳实践》——生命科学行业面临的痛点与挑战
带你读《生命科学行业云上解决方案及最佳实践》——生命科学行业面临的痛点与挑战
186 0
|
安全
《快递行业云上技术服务白皮书》——4. 快递行业技术服务最佳实践——4.3 技术服务展望——4.3.4 应用架构优化
《快递行业云上技术服务白皮书》——4. 快递行业技术服务最佳实践——4.3 技术服务展望——4.3.4 应用架构优化
100 0
|
运维 监控 Cloud Native
|
运维 Cloud Native 搜索推荐
打造数字化服务能力,中国联通如何借助云原生技术实现增长突围?
中国联通与阿里云结合阿里云原生 PaaS、阿里飞天操作系统、阿里云原生数据库以及中国联通天宫平台,共同研发运营商级专有云平台“天宫云”,支撑中国联通核心业务应用。
打造数字化服务能力,中国联通如何借助云原生技术实现增长突围?
|
存储 机器学习/深度学习 数据安全/隐私保护
金融数据智能在蚂蚁金服的现状与发展
摘要:随着金融行业越来越复杂的融合场景和海量数据的出现,新一代数据技术架构和金融计算核心引擎呼之欲出。在2019杭州云栖大会开发者峰会上,蚂蚁金服计算存储首席架构师萧河就为大家分享了金融数据智能在蚂蚁金服的现状与发展。
3007 0