用技术解决看似不可能的事

简介: 当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。

 

图,英文为Graph,是用来表示对象和对象之间关联关系的数据结构。图计算即以图数据模型来完整地抽象和分析数据之间关联关系的计算过程,是人工智能领域的前沿技术,也是目前为止最接近人脑建模的技术。

在蚂蚁集团的金融风控场景中,图计算技术的应用显著提升了欺诈洗钱等金融风险的实时识别能力和审理分析效率,成为了守护用户利益的重要堡垒。

 

当然,它的能力不光识别诈骗。

 

如果说人工智能是现代科学的“皇冠”,以图计算为代表的底层技术,可以说是皇冠上的“明珠”。蚂蚁有一支团队,专门从事这颗“明珠”的“雕琢”,赤宵和桥七就是其中的成员。小编和他们聊了聊,这项技术背后的故事。

解决看似不可能的问题

2015年,蚂蚁集团启动图数据库开发,开始了图计算技术的布局。次年蚂蚁自研的图数据库版本GeaBase1.0正式上线,接入支付宝链路并第一次参与当年的双11。2017年,图数据库经历新春五福大考,关系网络和可信体系的数据突破千亿条,成为支付宝主链路中不可或缺的关键技术。

 

如今,赤宵是这个团队的重要成员。

image.gif图片.png

赤宵(上排左三)参加团队活动

 

28岁清华博士毕业后,赤宵在微软亚洲研究院工作了6年,从事分布式计算机和大规模机器学习,之后一直在图相关技术领域开展研究。2016年,赤宵和他清华的博士同学,在导师陈文光的支持下共同成立了费马科技公司,以清华图计算学术研究作为支撑,发布了支持超大规模图数据快速处理的图计算产品。

 

技术不等于产品,技术能实现多大的价值,需要真正地用起来。所谓,“产学研结合”,最后的产业化实现这一关,对于技术价值的衡量至关重要。

 

源于对产、学、研结合的向往, 2020年赤宵和费马科技核心团队加入了蚂蚁图计算团队,他们有一个共同的愿望,就是希望推动图计算技术的广泛应用,让这项技术真正达到世界第一的综合水准。而蚂蚁集团在图计算领域深耕多年,拥有深厚的研发实力和丰富的应用场景,赤宵和团队希望能在蚂蚁发挥这项技术应有的价值,“图计算其实真的能解决很多事情。”

 

2020年,蚂蚁图计算团队推出了大规模图计算平台TuGraph。TuGraph全面协助支付宝完成了风控体系升级,实现反欺诈从个体防控到群体识别再到团伙成员的精准识别,达到了时序图计算能力上限。TuGraph也于当年通过了信通院大数据产品能力评测。

 

“在蚂蚁,图计算的技术魅力得到了很大的释放”,赤宵说。

 

比如,在反欺诈场景。“因为我们尽可能在风险转账行为发生之前进行拦截”,需要对海量数据进行在线实时分析,也对系统提出了很高的要求,但蚂蚁自研的TuGraph集齐了图计算最优性能之大成,集合了实时和时序大规模图分析能力,具备毫秒级处理延时,解决了这个“看似不可能的问题”。对于反欺诈和反洗钱等复杂问题的分析,图计算技术深入到了这些应用场景的毛细血管。

 

去年开始,赤宵和团队开始了一些共建行业的项目,比如携手ISO/IEC JTC/SC32/WG3工作组,参与ISO GQL图数据库标准语言标准制定,提供图查询语言的方案建议,为行业生态圈建设提出建设性意见。

 

作为布道者,赤宵也把蚂蚁图计算技术经验输出到了越来越多的行业,得到了很好的落地。就在2021年,蚂蚁TuGraph入选了IDC推荐的主流图数据库供应商。去年底,图计算团队实现了基于完美哈希的实时图存储,大幅提升图数据库查询性能,这一设计在业内属于首创,同时也是理论上最高效的图存储模型。赤宵表示,新的存储系统有望于今年上半年推向生产系统。

 

因为现在带着一个团队在做更具体的事,赤宵的目标比较简单纯粹,就是持续优化图计算的性能。长远来看,赤宵希望图计算在更多场景发挥作用,去开拓我们认知之外的领域。

用起来,技术会发光

“好的技术不发论文非常可惜。”这是桥七的感慨。

 

今年32岁的桥七,是赤宵的师弟,本科、硕士、博士都出自清华,坊间把桥七这样的人才统称为“三清团”,他也经常被团队同学调侃是 “三清团”青年代表。

图片.png

生活中桥七热爱户外活动

桥七介绍,图计算第一次被广泛讨论,是2010年谷歌发表的一篇相关论文。近年来,图计算虽然在技术开发和应用层面高速发展,但鲜少有影响力的学术成果。图计算在蚂蚁的应用已经迈入了非常成熟的阶段,但“我们蚂蚁的同学不是很喜欢发论文,这么好的技术积累却少见学术研究非常可惜”,桥七希望把蚂蚁的图计算成果推向学界。

 

技术用在今天,也要看到明天。

 

作为一项前沿性的技术,学术研究领域对于技术的判断往往比应用场景更具前瞻性,图计算团队也少不了智囊团的战略性输入。桥七的另一个重要工作,就是用新的、系统的研究,为业务团队从实际角度提供策略性建议,站在整体和复盘性的视角对于技术的使用进行分析,做出一套符合时代需求的技术设计。“当下的业务往前走,对技术提出的挑战也是往前走的,但做技术研究要更加往前看,到时再解决就手忙脚乱了”。

 

桥七总结了一套兼顾“当下”和“未来”的工作方法:做产品需要从业务角度考虑问题,客户第一。很多情况下为了满足业务需要,论文里的技术用就要费点劲,需要结合实际情况考虑很多事情。研究、发论文和做好产品,需要侧重的方面很不一样。应该想办法把做得好的事情转化成商业化的场景。“做好场景跟发一篇好的论文还挺不一样的。”

 

当然,这种方法的落地过程并非一帆风顺。桥七曾经向业务部门提出过一套新型系统,各项系数、POC结果业务方认可,但也遇到了问题,现有的系统能够满足业务需求,新系统替换会产生一定的风险,产品可以做到完美,但实际应用可能只需要80%。所以,技术要走出实验室,在应用场景中用起来,才知道它的边界和价值有多大。

 

目前,蚂蚁的图计算系统已经在能源、金融、工业、政务服务行业得到了应用,但这距离图计算团队的技术理想还有一定差距。

 

“业界现有的产品和技术应用距离目标还有很大发展空间。并且图计算在整个社会的应用和感知还不够广,可能常常出现在分析师报告、某些厂商的文章里,但是一些社会问题,比如流行病传播、社会治安管理等”,都是图计算技术能大放异彩的领域。

后记

科研,是创新的源动力。

产、学、研结合,必将迎来科研的“黄金时代”,实现产业化转化,真正做到“科技为人”。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
10月前
|
人工智能 数据挖掘 程序员
代码力量:探寻编程在现代社会中的无限可能性
代码力量:探寻编程在现代社会中的无限可能性
|
22天前
|
设计模式 人工智能 算法
当想象遭遇现实,究竟碰撞出何种火花?
当想象遭遇现实,究竟碰撞出何种火花?
|
人工智能 小程序
行动派:想到就做,无关乎与成功或失败,重在过程!
行动派:想到就做,无关乎与成功或失败,重在过程!
203 0
编写s=1+2+3+...+n思路打破认知
最近在和领导讨论架构设计,其中涉及到如何通过代码来体现面向对象?通过一个例子来打破了原有的认知,以此总结记录自己的提升和成长
|
存储 编译器 Linux
C生万物 | 窥探数组设计的种种陷阱
数组在设计的时候为何会出现那么多纰漏?数组越界是如何导致的?,我们来一探究竟🔍
77 0
C生万物 | 窥探数组设计的种种陷阱
“写代码的时候,不能对自己「妥协」” | 技术人金句系列
“写代码的时候,不能对自己「妥协」” | 技术人金句系列
100 0
谈谈讲清楚这件事的重要性
如何讲清楚一件事我相信很多人都很困惑也很无助,尤其是在晋升场合,在向上汇报或者是做大范围分享的时候,恨不得找个地缝钻进去。很多时候我们常常是这样安慰自己,我是实干派技术人,不需要那些花里胡哨的东西,我技术过硬比什么都重要。曾经一度我也是这样认为,最后改变我这个想法的是一句话:如果你讲不清楚多半是想不清楚,如果你都想不清楚如何能够带领更多人拿到结果?
1616 12
|
算法
解决这三个误区,才能真正学好算法
记录一下最近学习算法的一些思考
126 0
|
程序员 开发工具 开发者
程序员如何克服——可怕的“职业倦怠”
  程序员这个职业压力大,节奏快,任务繁重,所以很容易令人感觉倦怠,令人感觉烦躁,郁闷,疲惫不堪。程序员如何克服可怕的“职业倦怠”,方法如下:   丰盛的早餐——身处高科技产业漩涡的我们常常会熬夜到凌晨两三点,然后又因为起得晚急匆匆赶去上班,因而没时间吃任何早餐。又或者,可能你只能在路上一些脏兮兮的早餐店中买点小得可怜的熏肉三明治。我们都知道早餐是一天中最重要的一餐。而且不仅仅是要吃早饭,吃什么也很重要。要吃一些富含蛋白质的健康食品,如豆类,鳄梨和全麦面包。不要吃白面包和早餐麦片,糖分太多,会让人血糖升高而瞌睡。   准时上床睡觉——预备9个小时的睡眠时间,保证能睡到7或8个小时。有的人
195 0

相关实验场景

更多