“大规模图计算系统GeaGraph”入选2021世界互联网领先科技成果

简介: 蚂蚁集团和清华大学联合研发的大规模图计算系统GeaGraph,能在万亿边图上进行实时查询,在国际标准图数据库测试中位列第一,处理规模和性能均达到了国际领先水平。

9月26日,2021年世界互联网大会乌镇峰会开幕。


14项世界互联网领先科技成果,也在当日的乌镇揭晓,蚂蚁集团联合清华大学自主研发的“大规模图计算系统GeaGraph”项目入选获奖。


112.jpg

(图说:CCTV2全程直播成果发布)


高性能图计算,被认为是全球尖端科技的一个重要前沿,在电信、医疗、制造、能源等领域有广阔的应用价值和前景。


蚂蚁集团和清华大学联合研发的大规模图计算系统GeaGraph,能在万亿边图上进行实时查询,在国际标准图数据库测试中位列第一,处理规模和性能均达到了国际领先水平。


中国工程院院士、清华大学计算机系教授郑纬民认为:“GeaGraph给了我们一个很好的例子:产、学、研结合,高校和科技领先企业共同突破技术难关,并将其规模化应用。”


113.jpg

(图说:蚂蚁集团董事长兼CEO井贤栋和蚂蚁图计算团队在成果发布现场)


以下为郑纬民发表在光明网的署名文章《郑纬民:加强产学研合作是加快解决我国自主基础软件升级的有效模式》全文:


加强产学研合作是加快解决我国自主基础软件升级的有效模式


    9月26日,世界互联网大会领先科技成果奖揭晓了,我非常欣喜地看到,蚂蚁集团和清华大学联合研究的《大规模图计算系统GeaGraph》位列其中。这不仅代表我国在一个系统软件的分支上取得了国际领先水平的成果,更是国内软件领域在产学研合作的一个成功案例,对未来国内基础软件的发展提供了很好的示范。


  图模型是一种新型的数据模型,通过将实体和关系抽象为图上的点和边,并在图上进行深入分析。与传统的关系模型相比,图模型能够进行更加深入的关系分析,因而在金融反欺诈、反洗钱、互联网搜索、智能制造、能源互联网等领域拥有广泛的应用前景。


  清华大学计算机系高性能所从2010年左右就开始研究图计算相关技术,并研究了一系列图计算系统。其中2016年研制成功的双子星图计算系统比业界常用的开源图计算引擎GraphX性能提高了约100倍,得到了业界的广泛关注。为了能推动技术的广泛应用,2016年从事图计算系统的清华师生成立了费马科技有限公司。费马公司在推进双子星系统应用的同时,进一步开发出了具有国际领先性能的图数据库产品TuGrpah,能支持完整的图数据库事务,并在2020年通过了国际图数据库标准组织LDBC的认证测试,是国内首家通过这一认证测试的图数据库,认证成绩高居第一,是第二名的7.6倍。


  蚂蚁集团是一家具有科技领先能力的公司,国内乃至全球最大的用户量和峰值交易量的需求使得蚂蚁集团对图计算有着丰富的场景。利用图计算技术处理支付宝的反欺诈、反套现等难题,可以比传统技术更加适用。从2015年起,蚂蚁集团开始自主研发了分布式图数据库、流式图计算等图计算技术系统,并在内部应用中得到了良好的效果。


  2020年,蚂蚁集团进一步整合了自有的技术系统,以及清华大学和费马公司研制的相关系统,升级形成了一套完整的图计算系统GeaGraph。这套系统集成了各方原有的优势,可以不夸张地说,无论从功能的完整性,还是吞吐率、响应时间等指标,GeaGraph都达到了世界领先水平,是当之无愧的世界领先科技成果。


  当然,我们也不应在现有的成绩上骄傲自满,固步自封。应该看到全球图计算领域的发展仍然处在早期阶段,比如图查询语言的定义还缺乏类似关系代数的坚实理论基础;许多国内外图数据库的写入性能都非常差,对于用户实际需要的混合事务处理与分析类任务处理还不够得心应手,大部分数据库甚至不能通过国际标准测试;类似物化视图这类能够极大提高复杂查询性能的技术在图数据库上基本还是空白。我们期待通过更加积极的产学研合作,进一步提高我国在图计算这一细分系统软件领域的领先优势。


  更重要的是,我们期待类似GeaGraph这样的产学研合作案例能够成规模的复制,从而大大加速我国先进基础软件的研发工作。


  我一直强调一个观点,基础软件领域的国产化不应只是低水平的替代,更不应该只是开源软件的换皮。我强调要学会“从头构建先进的系统软件”。那么先进性从何而来?我想GeaGraph给了我们一个很好的例子:产、学、研结合,高校和科技领先企业共同突破技术难关并将其规模化应用。


  我们期待有更多的中国大学和科技公司加入到这一模式的探索中来。这种“产学研”结合的技术开发和应用全链条实践的模式是硅谷成功的秘诀之一,如果能够在我国顺畅运行和广泛复制,必将大大加快解决我国基础软件领域的卡脖子问题的进度,逐步构建出源于中国的自己研发的先进基础软件集。(end)


相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
3月前
|
存储 人工智能 芯片
|
7月前
|
存储 人工智能 数据可视化
伙伴云连续2年入选Gartner《中国分析平台市场指南》,数据分析能力遥遥领先
伙伴云作为中国分析与商业智能平台代表性厂商,因出色的数据分析能力,入选Gartner2023《中国分析平台市场指南》(《Market Guide for Analytics Platforms, China》,以下简称“指南”),成为入选该报告中唯一一家零代码厂商。
98 0
|
8月前
|
存储 人工智能 NoSQL
杭州悦数入选 Gartner®《中国数据分析与人工智能技术成熟度曲线,2023》
近日, Gartner 发布了《中国数据分析与人工智能技术成熟度曲线》(即《Hype Cycle™ for Data, Analytics and AI in China, 2023》July 2023),我们相信,杭州悦数凭借其出色的性能和应用表现以及其在市场上的实力和影响力入选知识图谱代表厂商。
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
悦数图数据库:图技术和 AI 在金融行业的应用及技术前瞻
一起来看看 Graph 和 AI 结合金融领域的案例以及悦数图数据库在做的一些大语言模型及前沿技术工具。
悦数图数据库:图技术和 AI 在金融行业的应用及技术前瞻
|
11月前
|
数据采集 机器学习/深度学习 人工智能
北京出手通用人工智能:产业创新伙伴计划公布,要推动大模型产业加速落地
北京出手通用人工智能:产业创新伙伴计划公布,要推动大模型产业加速落地
280 0
|
11月前
|
存储 达摩院 网络协议
《达摩院2023十大科技趋势》——产业革新——端网融合的可预期网络
《达摩院2023十大科技趋势》——产业革新——端网融合的可预期网络
242 0
|
11月前
|
机器学习/深度学习 人工智能 城市大脑
全球首个知识增强千亿大模型鹏城-百度·文心发布,打破AI技术与行业落地鸿沟
全球首个知识增强千亿大模型鹏城-百度·文心发布,打破AI技术与行业落地鸿沟
|
存储 弹性计算 人工智能
洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地
基于阿里云第七代实例构建的隐私计算解决方案,提供稳定可靠、灵活调度的算力来源,更好地帮助洞见科技为政务、金融等客户打破数据孤岛,赋能数据价值的安全释放和数据智能的合规应用。
洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地
|
机器学习/深度学习 人工智能 自然语言处理
人工智能大规模应用遇阻,多家企业推出RPA,或成AI落地最佳方式
让每个企业具备AI应用场景,RPA已成企业实现人工智能最佳捷径 人工智能大规模应用遇阻,多家AI企业推出RPA,或成AI落地最佳方式 无视企业信息化场景差异,RPA或成人工智能落地最佳方式 全文约3900字, 阅读时间约8分钟
206 0
人工智能大规模应用遇阻,多家企业推出RPA,或成AI落地最佳方式
|
存储 安全 BI
清华大学高琪瑞:基于云端视觉计算建设全球先进的工科实验教学平台
利用阿里云的云端视觉计算解决方案,清华大学动力工程及工程热物理国家级实验教学中心建设了虚拟仿真工科实验教学平台。本篇内容通过阐述视觉计算在工科实验教学中的应用、全球先进的工科实验教学平台建设等方面内容,总结出基于视觉计算和云的教育模式是工科实验教学发展的必然趋势。
清华大学高琪瑞:基于云端视觉计算建设全球先进的工科实验教学平台