用技术解决看似不可能的事

简介: 当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

 

图,英文为Graph,是用来表示对象和对象之间关联关系的数据结构。图计算即以图数据模型来完整地抽象和分析数据之间关联关系的计算过程,是人工智能领域的前沿技术,也是目前为止最接近人脑建模的技术。

在蚂蚁集团的金融风控场景中,图计算技术的应用显著提升了欺诈洗钱等金融风险的实时识别能力和审理分析效率,成为了守护用户利益的重要堡垒。

 

当然,它的能力不光识别诈骗。

 

如果说人工智能是现代科学的“皇冠”,以图计算为代表的底层技术,可以说是皇冠上的“明珠”。蚂蚁有一支团队,专门从事这颗“明珠”的“雕琢”,赤宵和桥七就是其中的成员。小编和他们聊了聊,这项技术背后的故事。

解决看似不可能的问题

2015年,蚂蚁集团启动图数据库开发,开始了图计算技术的布局。次年蚂蚁自研的图数据库版本GeaBase1.0正式上线,接入支付宝链路并第一次参与当年的双11。2017年,图数据库经历新春五福大考,关系网络和可信体系的数据突破千亿条,成为支付宝主链路中不可或缺的关键技术。

 

如今,赤宵是这个团队的重要成员。

image.gif图片.png

赤宵(上排左三)参加团队活动

 

28岁清华博士毕业后,赤宵在微软亚洲研究院工作了6年,从事分布式计算机和大规模机器学习,之后一直在图相关技术领域开展研究。2016年,赤宵和他清华的博士同学,在导师陈文光的支持下共同成立了费马科技公司,以清华图计算学术研究作为支撑,发布了支持超大规模图数据快速处理的图计算产品。

 

技术不等于产品,技术能实现多大的价值,需要真正地用起来。所谓,“产学研结合”,最后的产业化实现这一关,对于技术价值的衡量至关重要。

 

源于对产、学、研结合的向往, 2020年赤宵和费马科技核心团队加入了蚂蚁图计算团队,他们有一个共同的愿望,就是希望推动图计算技术的广泛应用,让这项技术真正达到世界第一的综合水准。而蚂蚁集团在图计算领域深耕多年,拥有深厚的研发实力和丰富的应用场景,赤宵和团队希望能在蚂蚁发挥这项技术应有的价值,“图计算其实真的能解决很多事情。”

 

2020年,蚂蚁图计算团队推出了大规模图计算平台TuGraph。TuGraph全面协助支付宝完成了风控体系升级,实现反欺诈从个体防控到群体识别再到团伙成员的精准识别,达到了时序图计算能力上限。TuGraph也于当年通过了信通院大数据产品能力评测。

 

“在蚂蚁,图计算的技术魅力得到了很大的释放”,赤宵说。

 

比如,在反欺诈场景。“因为我们尽可能在风险转账行为发生之前进行拦截”,需要对海量数据进行在线实时分析,也对系统提出了很高的要求,但蚂蚁自研的TuGraph集齐了图计算最优性能之大成,集合了实时和时序大规模图分析能力,具备毫秒级处理延时,解决了这个“看似不可能的问题”。对于反欺诈和反洗钱等复杂问题的分析,图计算技术深入到了这些应用场景的毛细血管。

 

去年开始,赤宵和团队开始了一些共建行业的项目,比如携手ISO/IEC JTC/SC32/WG3工作组,参与ISO GQL图数据库标准语言标准制定,提供图查询语言的方案建议,为行业生态圈建设提出建设性意见。

 

作为布道者,赤宵也把蚂蚁图计算技术经验输出到了越来越多的行业,得到了很好的落地。就在2021年,蚂蚁TuGraph入选了IDC推荐的主流图数据库供应商。去年底,图计算团队实现了基于完美哈希的实时图存储,大幅提升图数据库查询性能,这一设计在业内属于首创,同时也是理论上最高效的图存储模型。赤宵表示,新的存储系统有望于今年上半年推向生产系统。

 

因为现在带着一个团队在做更具体的事,赤宵的目标比较简单纯粹,就是持续优化图计算的性能。长远来看,赤宵希望图计算在更多场景发挥作用,去开拓我们认知之外的领域。

用起来,技术会发光

“好的技术不发论文非常可惜。”这是桥七的感慨。

 

今年32岁的桥七,是赤宵的师弟,本科、硕士、博士都出自清华,坊间把桥七这样的人才统称为“三清团”,他也经常被团队同学调侃是 “三清团”青年代表。

图片.png

生活中桥七热爱户外活动

桥七介绍,图计算第一次被广泛讨论,是2010年谷歌发表的一篇相关论文。近年来,图计算虽然在技术开发和应用层面高速发展,但鲜少有影响力的学术成果。图计算在蚂蚁的应用已经迈入了非常成熟的阶段,但“我们蚂蚁的同学不是很喜欢发论文,这么好的技术积累却少见学术研究非常可惜”,桥七希望把蚂蚁的图计算成果推向学界。

 

技术用在今天,也要看到明天。

 

作为一项前沿性的技术,学术研究领域对于技术的判断往往比应用场景更具前瞻性,图计算团队也少不了智囊团的战略性输入。桥七的另一个重要工作,就是用新的、系统的研究,为业务团队从实际角度提供策略性建议,站在整体和复盘性的视角对于技术的使用进行分析,做出一套符合时代需求的技术设计。“当下的业务往前走,对技术提出的挑战也是往前走的,但做技术研究要更加往前看,到时再解决就手忙脚乱了”。

 

桥七总结了一套兼顾“当下”和“未来”的工作方法:做产品需要从业务角度考虑问题,客户第一。很多情况下为了满足业务需要,论文里的技术用就要费点劲,需要结合实际情况考虑很多事情。研究、发论文和做好产品,需要侧重的方面很不一样。应该想办法把做得好的事情转化成商业化的场景。“做好场景跟发一篇好的论文还挺不一样的。”

 

当然,这种方法的落地过程并非一帆风顺。桥七曾经向业务部门提出过一套新型系统,各项系数、POC结果业务方认可,但也遇到了问题,现有的系统能够满足业务需求,新系统替换会产生一定的风险,产品可以做到完美,但实际应用可能只需要80%。所以,技术要走出实验室,在应用场景中用起来,才知道它的边界和价值有多大。

 

目前,蚂蚁的图计算系统已经在能源、金融、工业、政务服务行业得到了应用,但这距离图计算团队的技术理想还有一定差距。

 

“业界现有的产品和技术应用距离目标还有很大发展空间。并且图计算在整个社会的应用和感知还不够广,可能常常出现在分析师报告、某些厂商的文章里,但是一些社会问题,比如流行病传播、社会治安管理等”,都是图计算技术能大放异彩的领域。

后记

科研,是创新的源动力。

产、学、研结合,必将迎来科研的“黄金时代”,实现产业化转化,真正做到“科技为人”。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
4月前
|
算法 UED
探索编程思维:不仅是代码,更是解决问题的艺术
【5月更文挑战第24天】 在数字世界的舞台上,编程不单是一系列指令的排列组合,它更是一种独特的思维方式。本文将深入探讨编程思维的本质及其在问题解决过程中的应用。我们将剖析编程思维如何影响逻辑构建、创新思考和系统分析,并通过实例说明如何将编程原则应用于日常生活和非技术领域。
|
SQL
工作中的成长是从摆脱低水平勤奋开始的吗?
成长的本质是自我革新,成长就是在不断变化中的积极面。深度思考、目标设定、自律实践、持续学习、总结反思等步骤可以帮助我们成长,同时也需要避免陷入低水平勤奋的陷阱,不要忙于行动而忽视了反思和学习。
136 1
|
设计模式 小程序 测试技术
面对复杂问题时,系统思考助你理解问题本质
面对复杂问题时,系统思考助你理解问题本质
223 0
|
存储 编译器 Linux
C生万物 | 窥探数组设计的种种陷阱
数组在设计的时候为何会出现那么多纰漏?数组越界是如何导致的?,我们来一探究竟🔍
65 0
C生万物 | 窥探数组设计的种种陷阱
|
安全 UED
互联网思维和做事方式
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。本文梳理了互联网思维和做事方式,对于从传统行业加入互联网的人来说,下面的描述,是值得反复琢磨的。
141 0
还在担心工作要被取代?现实却是机器人已经开始被开除了
短时间内,所谓的“机器人酒店”都是噱头。
340 0
|
测试技术 程序员
那些会阻碍程序员成长的细节[1]
罗马非一日建成,软件系统也不是一天能够写出来的,在经年累月的编码生活中,总会有那么些个不经意的瞬间暴露出来,而这些不经意的外在表现日积月累,犹如水滴石穿,会产生巨大的力量反作用于程序员的成长。我简单列了几条,你来看一看,兴许就在身边实实在在发生过。
1127 0