近日,国际关联数据基准委员会(Linked Data Benchmark Council,以下简称LDBC)公布了最新SNB Interactive基准测试(声明式查询)结果:
阿里云开源的GraphScope Flex以超过80,000 QPS(每秒查询数)的吞吐性能打破历史纪录,性能较第二名提升1倍。
图计算引擎在处理海量关系数据上具备天然优势,能够提高实时推荐的效率和准确性。以金融风控场景为例,大量人员和事件构成一张庞大的图关系网,通过图上关联分析,可以快速挖掘异常行为,识别异常人员和群体,及时避免风险。
GraphScope是业界首个开源的一站式大规模图计算引擎,目前已广泛应用于金融风控、网络安全及社交网络分析等领域。
双场景登顶,声明式与命令式查询全面领先
LDBC是图数据与图计算领域的国际权威组织,其推出的Social Network Benchmark(SNB)评测基准通过模拟Facebook社交网络图,覆盖增删改查(CRUD)、最短路径、多跳查询等操作,全面衡量图引擎的功能和性能,是学术界和工业界公认的权威评测标准。该评测基准支持命令式与声明式两种实现方式。
- 命令式,需依赖图专家用编程语言手动编写和调优查询用例,GraphScope Flex于2024年以吞吐率超过130,000 QPS的成绩打破此前纪录,目前是该场景的纪录保持者。
- 声明式,使用图查询语言如Cypher编写查询用例,由系统自动优化。此次GraphScope Flex在扩展参数为300的声明式查询场景测试中,通过自动查询优化实现了高达80,510QPS的查询吞吐率,性能较第二名提升近1倍。
全栈优化,存储与计算协同创新
作为性能突破的基础支撑,GraphScope Flex在基础设施层通过存储、计算和调度层面实现了全栈创新:
- 高效存储结构:采用紧凑的邻接表存储,支持点边压缩与内存布局优化,在相同硬件下加载更大规模图数据。
- 智能内存管理:通过预取与缓存优化,提升图遍历局部性,显著降低内存访问延迟。
- 高并发事务支持:高效的MVCC版本管理技术,在保证高吞吐查询的同时,维持低延迟的数据修改能力。
自研框架,大幅优化声明式图查询性能
GraphScope Flex在查询层通过自主研发的GOpt优化框架,实现了声明式查询到高效执行计划的智能转化。目前,该研究成果已被数据库顶会SIGMOD 2025收录。
- 基于规则的优化(RBO):通过可插拔的启发式规则(如过滤条件下推、字段裁剪、连接合并)优化查询计划,减少中间结果并提升执行效率;
- 自动类型推断:动态推导模式中隐式类型约束,结合数据图模型验证类型有效性,避免无效遍历并提高基数估计准确性。
- 基于成本的优化(CBO):利用高阶统计和注册的后端成本模型,通过分支限界策略搜索最优执行计划,平衡数据特征与系统实现差异。
/ END /
来源 | 阿里云公众号