资本“抢滩”图数据库:国内企业如何构建新的护城河

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 21世纪经济报道见习记者 马婷婷 北京报道

因为优秀的表达能力、灵活的分析能力,图技术正在成为当下数据分析领域最热的技术之一。

知名研究机构Gartner 最新报告预计,到 2025 年,图技术将用于80%的数据分析创新,进一步促进企业的运营决策。但在去年底,这个数值仅有10%。

也有相关数据显示,截至2025年,包括图数据库管理系统(DBMS)在内的图技术市场将增长到32亿美元,复合年增长率为28.1%。目前,大型传统数据库管理系统供应商和初创公司都在瞄准这个极具爆发潜力的赛道。

与此同时,诸多嗅觉敏锐的投资机构对这一领域也在加速布局。在国外市场,去年,国际知名的图数据库公司Neo4j 宣布,完成由Eurazeo 领投、GV(原 Google Ventures)参投的 3.25亿美元F轮股权融资,创下图数据库与图计算赛道的最大单笔股权融资。美国图数据库厂商TigerGraph也在2021年完成了自己C轮1.05亿美金的融资。

在国内市场,投资机构也正在紧密的布局包括图数据库在内的整个数据库领域,2021年,获得新一轮融资的数据库企业超过了20家,一些头部基金投资的数量超过了3家。

今年初,国内图计算头部企业海致科技完成由中国互联网投资基金领投,上海人工智能产业投资基金、高瓴创投、君联资本、微村智科、一村资本、亿宸资本、禾其资本跟投的超过5亿元的D轮融资。

在此之前,海致科技完成多轮融资,投资方包括BAI资本、高瓴创投、君联资本等知名投资机构。

在投资行业人士看来,持续加码图数据库赛道投资,除了赛道本身的高爆发潜力,另一个重要原因是行业竞争格局未定,而该赛道本身的庞大市场空间,能够支撑出现多家独角兽企业。

技术:超越关系型数据库

近年,图数据库和图计算技术高速发展,其在复杂场景的计算速度,较传统关系型数据库有着指数级提升。

相比关系型数据库,图数据库更能实现对真实世界的完整描摹——以图的方式进行建模,能更好地表达万事万物之间的关系。

“某种程度而言,图数据库是知识图谱的一大核心技术环节,尤其是高性能图数据库,可以支持更大范围的实时应用场景,包括万亿级大图查询,对金融领域高频交易、工业互联网产效提升、能源领域电碳实时测算等应用场景都能提供强有力的支撑。”海致科技集团总裁杨娟在接受本报记者采访时表示。

在大数据时代,越来越多企业发现,原先的关系型数据库虽然简洁易理解,但它未必能全面真实的展现“现实世界”的描述。

以金融领域反洗钱为例,随着互联网技术发展与支付电子化,洗钱活动正变得更加专业复杂隐蔽。在关系型数据库有时对涉嫌洗钱行为的展示不够直观,难以甄别潜在的其他洗钱资金流向关系。

因此,越来越多全球银行正构建基于图数据库与知识图谱的反洗钱监测应用平台,通过覆盖千万级别节点和亿级关系,建立反洗钱客户关系网络,融合可疑交易特征和全量交易登录流水,以网络图谱方式动态展现资金流转全貌,完整准确展现团伙共用设备关系、账户资金分层结构和流向轨迹。如此,银行风控团队也能通过图的异常形态识别与人工智能图算法构建有效预警模型,从广大客群里“抓到”涉嫌洗钱团伙。

不仅是金融领域,全球工业制造,交通、能源、政府部门等各个领域都对图数据库技术的使用需求日益旺盛,而越来越多图数据库研发商通过将图算法和机器学习融合在一起,投射到各类业务场景,这项技术在金融、工业制造、能源、交通、医疗等领域得到迅猛发展。

然而,由于不同行业的数据来源与数据结构差别很大,如何通过图数据库、图计算等技术实现知识图谱升级迭代并构建多模态知识图谱,正成为新的挑战。

杨娟告诉记者,金融与政府行业的数据相对而言更具结构化特点,但能源、工业制造等行业有大量非结构化数据,比如文本、音频、视频、设备数据。这都需要图数据库研发商不断加大研发投入升级多模态知识图谱技术,致力于提升多模态知识数据的汇聚、检索、问答、模型训练、知识抽取、图谱构建与价值挖掘能力。

“我们的解决方案是采取底层技术与行业应用相隔离的策略,即产品是分层的,底下会有一个通用平台层,即各个行业都通用的技术组件,在这个平台层上,有不同行业团队去构建针对每个行业的场景和模型,与各个行业相匹配。”杨娟说。

市场:国内企业的超车机会

在关系型数据库领域,国外企业如Oracle、DB2因先发优势而具有较大优势,令国产关系型数据库行业的追赶周期相对较长。相比而言,图计算技术比较新,且国内外技术差距不大,令国内图数据库领域的追赶能力更强。

杨娟告诉记者,“尽管现在海外图数据库产品在国内占据较高市场份额,但国内相关产品正迅速兴起,且在某些技术环节具备较强竞争力。”

她分析指出:首先,多数海外图数据库产品仍是单机为主的技术架构,在分布式领域技术架构未必完善,无法在分布式环境下实现扩容,但国内众多图数据库研发平台基于云计算的分布式环境搭建新的技术架构,在分布式的高性能图计算方面具有一定领先性。

其次,基于国内企业需求的深入洞察与图计算技术迭代升级,国内图数据库企业在基础架构层设计、产品语言等方面也有一定前沿性。越来越多的国内金融机构与企业选择技术自主可控的图数据库企业合作,而后者通过与不同行业企业开展合作,产品性能得到更多打磨锤炼,业务空间得到进一步提升。

杨娟告诉记者,就近期参加的各种POC(Proof of concept,概念验证,针对客户具体应用的验证性测试)与评测分析,相比海外同行,海致的图数据库在不少性能方面表现更好。

在杨娟看来,超越欧美图数据库,形成新的竞争壁垒,国内企业必须在具体三大条件:一是,技术方面的深入洞察和前沿视野;二是,搭建卓越的技术研发团队,三是,与不同行业龙头企业开展合作,构建相关图数据库与图计算技术应用的“行业标准”。

据了解,海致今年参与了国际权威技术协会“关联数据基准委员会(LDBC)”立项的全球首个金融图数据库测试基准的编写,标准组成员还包括蚂蚁集团、Intel等国内外 6 家知名头部科技公司。

杨娟补充表示,国内大型互联网公司在图计算领域技术也有优势,但其技术、团队则与其主营业务紧密绑定,产品场景高度定制化。更多偏向2C端服务,因此与聚焦B端产品和服务的公司,并不存在诸多竞争。

“随着元宇宙产业的快速兴起,图能够更清晰的实现虚实映射,也是帮助数字人进行认知和思考的技术,我们也在探索图技术在元宇宙之中的应用以及发展空间。”杨娟说。

查看全文

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
2月前
|
关系型数据库 MySQL 数据库
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
|
3天前
|
安全 NoSQL 关系型数据库
阿里云数据库:助力企业数字化转型的强大引擎
阿里云数据库:助力企业数字化转型的强大引擎
|
7天前
|
安全 NoSQL 关系型数据库
阿里云数据库:构建高性能与安全的数据管理系统
在企业数字化转型过程中,数据库是支撑企业业务运转的核心。随着数据量的急剧增长和数据处理需求的不断增加,企业需要一个既能提供高性能又能保障数据安全的数据库解决方案。阿里云数据库产品为企业提供了一站式的数据管理服务,涵盖关系型、非关系型、内存数据库等多种类型,帮助企业构建高效的数据基础设施。
23 2
|
4天前
|
存储 NoSQL MongoDB
小川科技携手阿里云数据库MongoDB:数据赋能企业构建年轻娱乐生态
基于MongoDB灵活模式的特性,小川实现了功能的快速迭代和上线,而数据库侧无需任何更改
|
4天前
|
运维 NoSQL BI
简道云搭载阿里云MongoDB数据库,帮助数以万计企业重构业务系统
通过与MongoDB和阿里云团队的合作,让简道云少走了弯路,保障了线上服务的长期稳定运行,提高了吞吐效率,并相应降低了线上运行成本
|
6天前
|
NoSQL 关系型数据库 OLAP
如何选择最合适的数据库,帮助企业及个人业务更好的开展
如何选择最合适的数据库,帮助企业及个人业务更好的开展
|
2月前
|
SQL 关系型数据库 MySQL
|
2月前
|
存储 负载均衡 中间件
构建可扩展的分布式数据库:技术策略与实践
【8月更文挑战第3天】构建可扩展的分布式数据库是一个复杂而具有挑战性的任务。通过采用数据分片、复制与一致性模型、分布式事务管理和负载均衡与自动扩展等关键技术策略,并合理设计节点、架构模式和网络拓扑等关键组件,可以构建出高可用性、高性能和可扩展的分布式数据库系统。然而,在实际应用中还需要注意解决数据一致性、故障恢复与容错性以及分布式事务的复杂性等挑战。随着技术的不断发展和创新,相信分布式数据库系统将在未来发挥更加重要的作用。
|
3月前
|
监控 关系型数据库 MySQL
MySQL装机实战指南:从零开始构建高效数据库环境
通过本文的指南,您应该已经成功安装了MySQL,并对其进行了基本的配置和优化。MySQL是一个功能强大、灵活的数据库管理系统,通过不断的学习和实践,您将能够充分利用其潜力来满足您的业务需求。记住,定期备份数据库、更新软件以及进行性能监控是保持数据库环境健康和高效的关键。希望本文能对您有所帮助!
164 2
|
3月前
|
存储 自然语言处理 DataWorks
通过云上数据库三步构建RAG系统
本文介绍了如何使用OpenSearch LLM智能问答版通过云上数据库一站式构建RAG系统。
20101 10