用技术解决看似不可能的事

简介: 当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

 

图,英文为Graph,是用来表示对象和对象之间关联关系的数据结构。图计算即以图数据模型来完整地抽象和分析数据之间关联关系的计算过程,是人工智能领域的前沿技术,也是目前为止最接近人脑建模的技术。

在蚂蚁集团的金融风控场景中,图计算技术的应用显著提升了欺诈洗钱等金融风险的实时识别能力和审理分析效率,成为了守护用户利益的重要堡垒。

 

当然,它的能力不光识别诈骗。

 

如果说人工智能是现代科学的“皇冠”,以图计算为代表的底层技术,可以说是皇冠上的“明珠”。蚂蚁有一支团队,专门从事这颗“明珠”的“雕琢”,赤宵和桥七就是其中的成员。小编和他们聊了聊,这项技术背后的故事。

解决看似不可能的问题

2015年,蚂蚁集团启动图数据库开发,开始了图计算技术的布局。次年蚂蚁自研的图数据库版本GeaBase1.0正式上线,接入支付宝链路并第一次参与当年的双11。2017年,图数据库经历新春五福大考,关系网络和可信体系的数据突破千亿条,成为支付宝主链路中不可或缺的关键技术。

 

如今,赤宵是这个团队的重要成员。

image.gif图片.png

赤宵(上排左三)参加团队活动

 

28岁清华博士毕业后,赤宵在微软亚洲研究院工作了6年,从事分布式计算机和大规模机器学习,之后一直在图相关技术领域开展研究。2016年,赤宵和他清华的博士同学,在导师陈文光的支持下共同成立了费马科技公司,以清华图计算学术研究作为支撑,发布了支持超大规模图数据快速处理的图计算产品。

 

技术不等于产品,技术能实现多大的价值,需要真正地用起来。所谓,“产学研结合”,最后的产业化实现这一关,对于技术价值的衡量至关重要。

 

源于对产、学、研结合的向往, 2020年赤宵和费马科技核心团队加入了蚂蚁图计算团队,他们有一个共同的愿望,就是希望推动图计算技术的广泛应用,让这项技术真正达到世界第一的综合水准。而蚂蚁集团在图计算领域深耕多年,拥有深厚的研发实力和丰富的应用场景,赤宵和团队希望能在蚂蚁发挥这项技术应有的价值,“图计算其实真的能解决很多事情。”

 

2020年,蚂蚁图计算团队推出了大规模图计算平台TuGraph。TuGraph全面协助支付宝完成了风控体系升级,实现反欺诈从个体防控到群体识别再到团伙成员的精准识别,达到了时序图计算能力上限。TuGraph也于当年通过了信通院大数据产品能力评测。

 

“在蚂蚁,图计算的技术魅力得到了很大的释放”,赤宵说。

 

比如,在反欺诈场景。“因为我们尽可能在风险转账行为发生之前进行拦截”,需要对海量数据进行在线实时分析,也对系统提出了很高的要求,但蚂蚁自研的TuGraph集齐了图计算最优性能之大成,集合了实时和时序大规模图分析能力,具备毫秒级处理延时,解决了这个“看似不可能的问题”。对于反欺诈和反洗钱等复杂问题的分析,图计算技术深入到了这些应用场景的毛细血管。

 

去年开始,赤宵和团队开始了一些共建行业的项目,比如携手ISO/IEC JTC/SC32/WG3工作组,参与ISO GQL图数据库标准语言标准制定,提供图查询语言的方案建议,为行业生态圈建设提出建设性意见。

 

作为布道者,赤宵也把蚂蚁图计算技术经验输出到了越来越多的行业,得到了很好的落地。就在2021年,蚂蚁TuGraph入选了IDC推荐的主流图数据库供应商。去年底,图计算团队实现了基于完美哈希的实时图存储,大幅提升图数据库查询性能,这一设计在业内属于首创,同时也是理论上最高效的图存储模型。赤宵表示,新的存储系统有望于今年上半年推向生产系统。

 

因为现在带着一个团队在做更具体的事,赤宵的目标比较简单纯粹,就是持续优化图计算的性能。长远来看,赤宵希望图计算在更多场景发挥作用,去开拓我们认知之外的领域。

用起来,技术会发光

“好的技术不发论文非常可惜。”这是桥七的感慨。

 

今年32岁的桥七,是赤宵的师弟,本科、硕士、博士都出自清华,坊间把桥七这样的人才统称为“三清团”,他也经常被团队同学调侃是 “三清团”青年代表。

图片.png

生活中桥七热爱户外活动

桥七介绍,图计算第一次被广泛讨论,是2010年谷歌发表的一篇相关论文。近年来,图计算虽然在技术开发和应用层面高速发展,但鲜少有影响力的学术成果。图计算在蚂蚁的应用已经迈入了非常成熟的阶段,但“我们蚂蚁的同学不是很喜欢发论文,这么好的技术积累却少见学术研究非常可惜”,桥七希望把蚂蚁的图计算成果推向学界。

 

技术用在今天,也要看到明天。

 

作为一项前沿性的技术,学术研究领域对于技术的判断往往比应用场景更具前瞻性,图计算团队也少不了智囊团的战略性输入。桥七的另一个重要工作,就是用新的、系统的研究,为业务团队从实际角度提供策略性建议,站在整体和复盘性的视角对于技术的使用进行分析,做出一套符合时代需求的技术设计。“当下的业务往前走,对技术提出的挑战也是往前走的,但做技术研究要更加往前看,到时再解决就手忙脚乱了”。

 

桥七总结了一套兼顾“当下”和“未来”的工作方法:做产品需要从业务角度考虑问题,客户第一。很多情况下为了满足业务需要,论文里的技术用就要费点劲,需要结合实际情况考虑很多事情。研究、发论文和做好产品,需要侧重的方面很不一样。应该想办法把做得好的事情转化成商业化的场景。“做好场景跟发一篇好的论文还挺不一样的。”

 

当然,这种方法的落地过程并非一帆风顺。桥七曾经向业务部门提出过一套新型系统,各项系数、POC结果业务方认可,但也遇到了问题,现有的系统能够满足业务需求,新系统替换会产生一定的风险,产品可以做到完美,但实际应用可能只需要80%。所以,技术要走出实验室,在应用场景中用起来,才知道它的边界和价值有多大。

 

目前,蚂蚁的图计算系统已经在能源、金融、工业、政务服务行业得到了应用,但这距离图计算团队的技术理想还有一定差距。

 

“业界现有的产品和技术应用距离目标还有很大发展空间。并且图计算在整个社会的应用和感知还不够广,可能常常出现在分析师报告、某些厂商的文章里,但是一些社会问题,比如流行病传播、社会治安管理等”,都是图计算技术能大放异彩的领域。

后记

科研,是创新的源动力。

产、学、研结合,必将迎来科研的“黄金时代”,实现产业化转化,真正做到“科技为人”。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
21天前
|
设计模式 人工智能 算法
当想象遭遇现实,究竟碰撞出何种火花?
当想象遭遇现实,究竟碰撞出何种火花?
|
9月前
|
设计模式 算法 C语言
技术进步与个人成长:从代码到思维的演变
技术不仅塑造了我们的工作方式,更深刻地影响了我们的思维模式。本文探讨了在编程实践中,个人技术能力和思维方式如何相互影响和提升,重点讨论了一些关键的经验和感悟,以及这些经历对职业发展的深远影响。
88 0
|
10月前
|
UED
技术感悟:代码背后的思考
在当今数字化时代,技术已经成为生活和工作中不可或缺的一部分。作为技术从业者,我们常常陷入繁忙的编码和调试中,很少有时间去思考代码背后的深层含义。本文将探讨我们在编写代码时需要关注的思维过程,以及如何通过技术感悟来提高我们的编程能力。
发散性思维(一)——通过变通和联想来解决问题
发散性思维(一)——通过变通和联想来解决问题
133 0
发散性思维(一)——通过变通和联想来解决问题
谈谈讲清楚这件事的重要性
如何讲清楚一件事我相信很多人都很困惑也很无助,尤其是在晋升场合,在向上汇报或者是做大范围分享的时候,恨不得找个地缝钻进去。很多时候我们常常是这样安慰自己,我是实干派技术人,不需要那些花里胡哨的东西,我技术过硬比什么都重要。曾经一度我也是这样认为,最后改变我这个想法的是一句话:如果你讲不清楚多半是想不清楚,如果你都想不清楚如何能够带领更多人拿到结果?
1616 12
|
Web App开发 JSON 安全
魏永明:少谈情怀少作秀,多写代码多创新
魏永明:少谈情怀少作秀,多写代码多创新
406 0
|
前端开发 Java C++
谈谈刻意练习
谈谈刻意练习
|
设计模式 网络协议 算法
自学编程的八大误区!克服它们,豁然开朗!
说在前面 小伙伴们大家好,又是全新的一天。 关于“自学编程的一些常见误区”这个话题其实很早之前就在视频里聊过了。时间过去了大半年,也还是有很多小伙伴会提及各种自学过程中的常见疑惑,所以还是用文字总结一下这几点想法,和大家共勉。 误区1:忽略基础,盲目莽进 基础知识和基础路线真的非常重要,就以Java领域举例,现在的应用框架实在是太多了,五花八门,层出不穷,迭代的速度太快了。但是假如Java SE的基础不牢、网络协议和操作系统不熟,基本的设计模式不了解,那一味地追求学习新框架反而会让自己陷入迷茫与困顿。 基础牢固,应用框架的学习自然就不用惧怕了,很快就能切入核心,掌握原理。而且越时髦的东西
149 0
|
设计模式 架构师 NoSQL
从技术思维角度聊一聊『程序员』摆地摊的正确姿势
有人说程序员这个职业,三年升高工,七年做架构,十年送外卖。对此虽然我也曾非常认可,但现在我可以前瞻性(马后炮)地说四个字,杞人忧天!目光肤浅!正所谓天生我材必有用,用完再把外卖送,现在,新的风口——万亿【烟火经济】来了,除了送外卖我们又多了个新选择:摆地摊!一个人一辈子只有那么几次机会可能实现财务自由,机遇稍纵即逝,一定要牢牢把握住。
1058 0

相关实验场景

更多