资本“抢滩”图数据库:国内企业如何构建新的护城河

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 21世纪经济报道见习记者 马婷婷 北京报道

因为优秀的表达能力、灵活的分析能力,图技术正在成为当下数据分析领域最热的技术之一。

知名研究机构Gartner 最新报告预计,到 2025 年,图技术将用于80%的数据分析创新,进一步促进企业的运营决策。但在去年底,这个数值仅有10%。

也有相关数据显示,截至2025年,包括图数据库管理系统(DBMS)在内的图技术市场将增长到32亿美元,复合年增长率为28.1%。目前,大型传统数据库管理系统供应商和初创公司都在瞄准这个极具爆发潜力的赛道。

与此同时,诸多嗅觉敏锐的投资机构对这一领域也在加速布局。在国外市场,去年,国际知名的图数据库公司Neo4j 宣布,完成由Eurazeo 领投、GV(原 Google Ventures)参投的 3.25亿美元F轮股权融资,创下图数据库与图计算赛道的最大单笔股权融资。美国图数据库厂商TigerGraph也在2021年完成了自己C轮1.05亿美金的融资。

在国内市场,投资机构也正在紧密的布局包括图数据库在内的整个数据库领域,2021年,获得新一轮融资的数据库企业超过了20家,一些头部基金投资的数量超过了3家。

今年初,国内图计算头部企业海致科技完成由中国互联网投资基金领投,上海人工智能产业投资基金、高瓴创投、君联资本、微村智科、一村资本、亿宸资本、禾其资本跟投的超过5亿元的D轮融资。

在此之前,海致科技完成多轮融资,投资方包括BAI资本、高瓴创投、君联资本等知名投资机构。

在投资行业人士看来,持续加码图数据库赛道投资,除了赛道本身的高爆发潜力,另一个重要原因是行业竞争格局未定,而该赛道本身的庞大市场空间,能够支撑出现多家独角兽企业。

技术:超越关系型数据库

近年,图数据库和图计算技术高速发展,其在复杂场景的计算速度,较传统关系型数据库有着指数级提升。

相比关系型数据库,图数据库更能实现对真实世界的完整描摹——以图的方式进行建模,能更好地表达万事万物之间的关系。

“某种程度而言,图数据库是知识图谱的一大核心技术环节,尤其是高性能图数据库,可以支持更大范围的实时应用场景,包括万亿级大图查询,对金融领域高频交易、工业互联网产效提升、能源领域电碳实时测算等应用场景都能提供强有力的支撑。”海致科技集团总裁杨娟在接受本报记者采访时表示。

在大数据时代,越来越多企业发现,原先的关系型数据库虽然简洁易理解,但它未必能全面真实的展现“现实世界”的描述。

以金融领域反洗钱为例,随着互联网技术发展与支付电子化,洗钱活动正变得更加专业复杂隐蔽。在关系型数据库有时对涉嫌洗钱行为的展示不够直观,难以甄别潜在的其他洗钱资金流向关系。

因此,越来越多全球银行正构建基于图数据库与知识图谱的反洗钱监测应用平台,通过覆盖千万级别节点和亿级关系,建立反洗钱客户关系网络,融合可疑交易特征和全量交易登录流水,以网络图谱方式动态展现资金流转全貌,完整准确展现团伙共用设备关系、账户资金分层结构和流向轨迹。如此,银行风控团队也能通过图的异常形态识别与人工智能图算法构建有效预警模型,从广大客群里“抓到”涉嫌洗钱团伙。

不仅是金融领域,全球工业制造,交通、能源、政府部门等各个领域都对图数据库技术的使用需求日益旺盛,而越来越多图数据库研发商通过将图算法和机器学习融合在一起,投射到各类业务场景,这项技术在金融、工业制造、能源、交通、医疗等领域得到迅猛发展。

然而,由于不同行业的数据来源与数据结构差别很大,如何通过图数据库、图计算等技术实现知识图谱升级迭代并构建多模态知识图谱,正成为新的挑战。

杨娟告诉记者,金融与政府行业的数据相对而言更具结构化特点,但能源、工业制造等行业有大量非结构化数据,比如文本、音频、视频、设备数据。这都需要图数据库研发商不断加大研发投入升级多模态知识图谱技术,致力于提升多模态知识数据的汇聚、检索、问答、模型训练、知识抽取、图谱构建与价值挖掘能力。

“我们的解决方案是采取底层技术与行业应用相隔离的策略,即产品是分层的,底下会有一个通用平台层,即各个行业都通用的技术组件,在这个平台层上,有不同行业团队去构建针对每个行业的场景和模型,与各个行业相匹配。”杨娟说。

市场:国内企业的超车机会

在关系型数据库领域,国外企业如Oracle、DB2因先发优势而具有较大优势,令国产关系型数据库行业的追赶周期相对较长。相比而言,图计算技术比较新,且国内外技术差距不大,令国内图数据库领域的追赶能力更强。

杨娟告诉记者,“尽管现在海外图数据库产品在国内占据较高市场份额,但国内相关产品正迅速兴起,且在某些技术环节具备较强竞争力。”

她分析指出:首先,多数海外图数据库产品仍是单机为主的技术架构,在分布式领域技术架构未必完善,无法在分布式环境下实现扩容,但国内众多图数据库研发平台基于云计算的分布式环境搭建新的技术架构,在分布式的高性能图计算方面具有一定领先性。

其次,基于国内企业需求的深入洞察与图计算技术迭代升级,国内图数据库企业在基础架构层设计、产品语言等方面也有一定前沿性。越来越多的国内金融机构与企业选择技术自主可控的图数据库企业合作,而后者通过与不同行业企业开展合作,产品性能得到更多打磨锤炼,业务空间得到进一步提升。

杨娟告诉记者,就近期参加的各种POC(Proof of concept,概念验证,针对客户具体应用的验证性测试)与评测分析,相比海外同行,海致的图数据库在不少性能方面表现更好。

在杨娟看来,超越欧美图数据库,形成新的竞争壁垒,国内企业必须在具体三大条件:一是,技术方面的深入洞察和前沿视野;二是,搭建卓越的技术研发团队,三是,与不同行业龙头企业开展合作,构建相关图数据库与图计算技术应用的“行业标准”。

据了解,海致今年参与了国际权威技术协会“关联数据基准委员会(LDBC)”立项的全球首个金融图数据库测试基准的编写,标准组成员还包括蚂蚁集团、Intel等国内外 6 家知名头部科技公司。

杨娟补充表示,国内大型互联网公司在图计算领域技术也有优势,但其技术、团队则与其主营业务紧密绑定,产品场景高度定制化。更多偏向2C端服务,因此与聚焦B端产品和服务的公司,并不存在诸多竞争。

“随着元宇宙产业的快速兴起,图能够更清晰的实现虚实映射,也是帮助数字人进行认知和思考的技术,我们也在探索图技术在元宇宙之中的应用以及发展空间。”杨娟说。

查看全文

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
2月前
|
存储 机器学习/深度学习 人工智能
打造企业智能体(AI Agent)的重要技术-向量数据库
本篇介绍的是为通用大模型增加专业业务能力的重要技术:向量数据库
打造企业智能体(AI Agent)的重要技术-向量数据库
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
1月前
|
存储 数据处理 数据库
构建高性能的数据库查询引擎
本文将介绍如何构建一个高性能的数据库查询引擎,以提升数据库查询的效率和响应速度。通过优化查询计划、索引设计和数据存储等方面,可以实现更快速和可扩展的数据库查询,为应用程序提供更好的用户体验和数据处理能力。
|
1月前
|
存储 SQL 分布式计算
TiDB整体架构概览:构建高效分布式数据库的关键设计
【2月更文挑战第26天】本文旨在全面概述TiDB的整体架构,深入剖析其关键组件和功能,从而帮助读者理解TiDB如何构建高效、稳定的分布式数据库。我们将探讨TiDB的计算层、存储层以及其他核心组件,并解释这些组件是如何协同工作以实现卓越的性能和扩展性的。通过本文,读者将能够深入了解TiDB的整体架构,为后续的学习和实践奠定坚实基础。
|
1月前
|
人工智能 自然语言处理 NoSQL
悦数图数据库推出 AI 知识图谱构建器及图语言生成助手
随着人工智能应用在全球范围的普及和风靡,大语言模型技术(Large Language Model,简称 LLM)受到了广泛的关注和应用。而图数据库作为一种处理复杂数据结构的工具,能够为企业构建行业大语言模型提供强大的支持,包括丰富亿万级别的上下文信息,提升模型的应答精度,从而实现企业级的应用效果。同时,Graph+LLM 可以助力快速构建知识图谱,帮助企业更深入地理解和挖掘数据价值。
|
2月前
|
SQL 关系型数据库 MySQL
【JavaEE进阶】 数据库连接池与MySQL企业开发规范
【JavaEE进阶】 数据库连接池与MySQL企业开发规范
|
2月前
|
缓存 监控 关系型数据库
构建高效的数据库应用:Python 实践
在当今数据驱动的世界中,构建高效的数据库应用程序对于企业和个人来说至关重要。Python 作为一种强大的编程语言,提供了丰富的数据库工具和库,使得开发人员能够轻松地构建高效、可靠的数据库应用程序。在本文中,我们将探讨一些关键的技术和最佳实践,以帮助你构建高效的数据库应用程序。
|
3月前
|
缓存 数据库 开发者
构建高性能的数据库查询语句优化策略
数据库查询是开发过程中常见的性能瓶颈之一。本文将介绍构建高性能数据库查询语句的优化策略,包括索引的设计与使用、查询语句的编写技巧、连接的优化等方面,帮助开发者提升数据库查询的效率和响应速度。
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
凭安征信引入阿里云PolarDB云数据库支撑企业征信核心业务系统
凭安征信是国家中小企业公共服务示范平台,主营信用管理服务包括信用管家、水滴信用及可信认证。通过采用阿里云PolarDB云原生数据库替代RDS数据库帮助客户全面实现业务系统性能提升1-2倍,通过PolarDB企业级能力的加持下,运维更加简便,操作更加简单,数据安全能力更强。
|
3月前
|
存储 SQL 分布式数据库
OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案
OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案