“大规模图计算系统GeaGraph”入选2021世界互联网领先科技成果

简介: 蚂蚁集团和清华大学联合研发的大规模图计算系统GeaGraph,能在万亿边图上进行实时查询,在国际标准图数据库测试中位列第一,处理规模和性能均达到了国际领先水平。

9月26日,2021年世界互联网大会乌镇峰会开幕。


14项世界互联网领先科技成果,也在当日的乌镇揭晓,蚂蚁集团联合清华大学自主研发的“大规模图计算系统GeaGraph”项目入选获奖。


112.jpg

(图说:CCTV2全程直播成果发布)


高性能图计算,被认为是全球尖端科技的一个重要前沿,在电信、医疗、制造、能源等领域有广阔的应用价值和前景。


蚂蚁集团和清华大学联合研发的大规模图计算系统GeaGraph,能在万亿边图上进行实时查询,在国际标准图数据库测试中位列第一,处理规模和性能均达到了国际领先水平。


中国工程院院士、清华大学计算机系教授郑纬民认为:“GeaGraph给了我们一个很好的例子:产、学、研结合,高校和科技领先企业共同突破技术难关,并将其规模化应用。”


113.jpg

(图说:蚂蚁集团董事长兼CEO井贤栋和蚂蚁图计算团队在成果发布现场)


以下为郑纬民发表在光明网的署名文章《郑纬民:加强产学研合作是加快解决我国自主基础软件升级的有效模式》全文:


加强产学研合作是加快解决我国自主基础软件升级的有效模式


    9月26日,世界互联网大会领先科技成果奖揭晓了,我非常欣喜地看到,蚂蚁集团和清华大学联合研究的《大规模图计算系统GeaGraph》位列其中。这不仅代表我国在一个系统软件的分支上取得了国际领先水平的成果,更是国内软件领域在产学研合作的一个成功案例,对未来国内基础软件的发展提供了很好的示范。


  图模型是一种新型的数据模型,通过将实体和关系抽象为图上的点和边,并在图上进行深入分析。与传统的关系模型相比,图模型能够进行更加深入的关系分析,因而在金融反欺诈、反洗钱、互联网搜索、智能制造、能源互联网等领域拥有广泛的应用前景。


  清华大学计算机系高性能所从2010年左右就开始研究图计算相关技术,并研究了一系列图计算系统。其中2016年研制成功的双子星图计算系统比业界常用的开源图计算引擎GraphX性能提高了约100倍,得到了业界的广泛关注。为了能推动技术的广泛应用,2016年从事图计算系统的清华师生成立了费马科技有限公司。费马公司在推进双子星系统应用的同时,进一步开发出了具有国际领先性能的图数据库产品TuGrpah,能支持完整的图数据库事务,并在2020年通过了国际图数据库标准组织LDBC的认证测试,是国内首家通过这一认证测试的图数据库,认证成绩高居第一,是第二名的7.6倍。


  蚂蚁集团是一家具有科技领先能力的公司,国内乃至全球最大的用户量和峰值交易量的需求使得蚂蚁集团对图计算有着丰富的场景。利用图计算技术处理支付宝的反欺诈、反套现等难题,可以比传统技术更加适用。从2015年起,蚂蚁集团开始自主研发了分布式图数据库、流式图计算等图计算技术系统,并在内部应用中得到了良好的效果。


  2020年,蚂蚁集团进一步整合了自有的技术系统,以及清华大学和费马公司研制的相关系统,升级形成了一套完整的图计算系统GeaGraph。这套系统集成了各方原有的优势,可以不夸张地说,无论从功能的完整性,还是吞吐率、响应时间等指标,GeaGraph都达到了世界领先水平,是当之无愧的世界领先科技成果。


  当然,我们也不应在现有的成绩上骄傲自满,固步自封。应该看到全球图计算领域的发展仍然处在早期阶段,比如图查询语言的定义还缺乏类似关系代数的坚实理论基础;许多国内外图数据库的写入性能都非常差,对于用户实际需要的混合事务处理与分析类任务处理还不够得心应手,大部分数据库甚至不能通过国际标准测试;类似物化视图这类能够极大提高复杂查询性能的技术在图数据库上基本还是空白。我们期待通过更加积极的产学研合作,进一步提高我国在图计算这一细分系统软件领域的领先优势。


  更重要的是,我们期待类似GeaGraph这样的产学研合作案例能够成规模的复制,从而大大加速我国先进基础软件的研发工作。


  我一直强调一个观点,基础软件领域的国产化不应只是低水平的替代,更不应该只是开源软件的换皮。我强调要学会“从头构建先进的系统软件”。那么先进性从何而来?我想GeaGraph给了我们一个很好的例子:产、学、研结合,高校和科技领先企业共同突破技术难关并将其规模化应用。


  我们期待有更多的中国大学和科技公司加入到这一模式的探索中来。这种“产学研”结合的技术开发和应用全链条实践的模式是硅谷成功的秘诀之一,如果能够在我国顺畅运行和广泛复制,必将大大加快解决我国基础软件领域的卡脖子问题的进度,逐步构建出源于中国的自己研发的先进基础软件集。(end)


相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
3月前
|
数据采集 人工智能 监控
猫行为识别检测数据集(近2000张图片已标注)| YOLO训练数据集 AI视觉检测
本数据集含近2000张高质量猫行为图像,标注4类静态姿态(趴卧、坐姿、睡眠、站立),采用YOLO标准格式,覆盖多场景、多光照与多姿态,适配YOLOv5/v8等模型,适用于智能宠物监控、健康分析及AI视觉研究。
|
存储 C# 图形学
【Unity 3D】C#数据类型和变量、命名规范的讲解(附源码)
【Unity 3D】C#数据类型和变量、命名规范的讲解(附源码)
600 1
|
SQL 移动开发 算法
MySQL 8.0.23 Hypergraph Join Optimizer代码详解
MySQL Join MySQL本身没有常规意义上的执行计划,一般情况就是通过JOIN和QEP_TAB这两个结构组成。QEP_TAB 的全称是Query Execution Plan Table,这个“Table“可以是物理表、内存表、常量表、子查询的结果表等等。作为整个单独JOIN执行计划载体之前还承担着整个执行路径的调用和流转,但是从8.0.20后,全面的生成了独立的
2081 0
MySQL 8.0.23 Hypergraph Join Optimizer代码详解
|
10月前
|
人工智能 弹性计算 自然语言处理
云速搭 AI 助理发布:对话式生成可部署的阿里云架构图
阿里云云速搭 CADT(Cloud Architect Design Tools)推出智能化升级——云小搭,一款基于大模型的 AI 云架构助手,致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。
1123 31
|
人工智能 开发者 Python
Chainlit:一个开源的异步Python框架,快速构建生产级对话式 AI 应用
Chainlit 是一个开源的异步 Python 框架,帮助开发者在几分钟内构建可扩展的对话式 AI 或代理应用,支持多种工具和服务集成。
2021 9
|
JavaScript IDE API
vue3中的单文件组件<script setup>和setup函数区别 详解(一)
vue3中的单文件组件<script setup>和setup函数区别 详解
1033 0
|
机器学习/深度学习 人工智能 搜索推荐
AI与体育训练:运动表现分析
【10月更文挑战第31天】本文探讨了AI在体育训练中的应用,特别是在运动表现分析方面。通过数据收集与处理、深度分析与挖掘、实时反馈与调整三个环节,AI为运动员和教练提供了高效、个性化的训练计划和比赛策略,显著提升了训练效率和比赛成绩。未来,AI将在数据隐私、情感理解及跨学科合作等方面继续发展,为体育事业带来更多可能性。
1589 1
|
存储 并行计算 算法
CUDA统一内存:简化GPU编程的内存管理
在GPU编程中,内存管理是关键挑战之一。NVIDIA CUDA 6.0引入了统一内存,简化了CPU与GPU之间的数据传输。统一内存允许在单个地址空间内分配可被两者访问的内存,自动迁移数据,从而简化内存管理、提高性能并增强代码可扩展性。本文将详细介绍统一内存的工作原理、优势及其使用方法,帮助开发者更高效地开发CUDA应用程序。
|
算法
【SPSS】列联表分析详细操作教程(附案例实战)
【SPSS】列联表分析详细操作教程(附案例实战)
3512 0
|
存储 NoSQL 算法
Redis过期处理策略、惰性删除、定期删除、RDB和AOF、内存淘汰机制
Redis过期处理策略、惰性删除、定期删除、RDB和AOF、内存淘汰机制
720 0

热门文章

最新文章