资本“抢滩”图数据库:国内企业如何构建新的护城河

本文涉及的产品
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: 21世纪经济报道见习记者 马婷婷 北京报道

因为优秀的表达能力、灵活的分析能力,图技术正在成为当下数据分析领域最热的技术之一。

知名研究机构Gartner 最新报告预计,到 2025 年,图技术将用于80%的数据分析创新,进一步促进企业的运营决策。但在去年底,这个数值仅有10%。

也有相关数据显示,截至2025年,包括图数据库管理系统(DBMS)在内的图技术市场将增长到32亿美元,复合年增长率为28.1%。目前,大型传统数据库管理系统供应商和初创公司都在瞄准这个极具爆发潜力的赛道。

与此同时,诸多嗅觉敏锐的投资机构对这一领域也在加速布局。在国外市场,去年,国际知名的图数据库公司Neo4j 宣布,完成由Eurazeo 领投、GV(原 Google Ventures)参投的 3.25亿美元F轮股权融资,创下图数据库与图计算赛道的最大单笔股权融资。美国图数据库厂商TigerGraph也在2021年完成了自己C轮1.05亿美金的融资。

在国内市场,投资机构也正在紧密的布局包括图数据库在内的整个数据库领域,2021年,获得新一轮融资的数据库企业超过了20家,一些头部基金投资的数量超过了3家。

今年初,国内图计算头部企业海致科技完成由中国互联网投资基金领投,上海人工智能产业投资基金、高瓴创投、君联资本、微村智科、一村资本、亿宸资本、禾其资本跟投的超过5亿元的D轮融资。

在此之前,海致科技完成多轮融资,投资方包括BAI资本、高瓴创投、君联资本等知名投资机构。

在投资行业人士看来,持续加码图数据库赛道投资,除了赛道本身的高爆发潜力,另一个重要原因是行业竞争格局未定,而该赛道本身的庞大市场空间,能够支撑出现多家独角兽企业。

技术:超越关系型数据库

近年,图数据库和图计算技术高速发展,其在复杂场景的计算速度,较传统关系型数据库有着指数级提升。

相比关系型数据库,图数据库更能实现对真实世界的完整描摹——以图的方式进行建模,能更好地表达万事万物之间的关系。

“某种程度而言,图数据库是知识图谱的一大核心技术环节,尤其是高性能图数据库,可以支持更大范围的实时应用场景,包括万亿级大图查询,对金融领域高频交易、工业互联网产效提升、能源领域电碳实时测算等应用场景都能提供强有力的支撑。”海致科技集团总裁杨娟在接受本报记者采访时表示。

在大数据时代,越来越多企业发现,原先的关系型数据库虽然简洁易理解,但它未必能全面真实的展现“现实世界”的描述。

以金融领域反洗钱为例,随着互联网技术发展与支付电子化,洗钱活动正变得更加专业复杂隐蔽。在关系型数据库有时对涉嫌洗钱行为的展示不够直观,难以甄别潜在的其他洗钱资金流向关系。

因此,越来越多全球银行正构建基于图数据库与知识图谱的反洗钱监测应用平台,通过覆盖千万级别节点和亿级关系,建立反洗钱客户关系网络,融合可疑交易特征和全量交易登录流水,以网络图谱方式动态展现资金流转全貌,完整准确展现团伙共用设备关系、账户资金分层结构和流向轨迹。如此,银行风控团队也能通过图的异常形态识别与人工智能图算法构建有效预警模型,从广大客群里“抓到”涉嫌洗钱团伙。

不仅是金融领域,全球工业制造,交通、能源、政府部门等各个领域都对图数据库技术的使用需求日益旺盛,而越来越多图数据库研发商通过将图算法和机器学习融合在一起,投射到各类业务场景,这项技术在金融、工业制造、能源、交通、医疗等领域得到迅猛发展。

然而,由于不同行业的数据来源与数据结构差别很大,如何通过图数据库、图计算等技术实现知识图谱升级迭代并构建多模态知识图谱,正成为新的挑战。

杨娟告诉记者,金融与政府行业的数据相对而言更具结构化特点,但能源、工业制造等行业有大量非结构化数据,比如文本、音频、视频、设备数据。这都需要图数据库研发商不断加大研发投入升级多模态知识图谱技术,致力于提升多模态知识数据的汇聚、检索、问答、模型训练、知识抽取、图谱构建与价值挖掘能力。

“我们的解决方案是采取底层技术与行业应用相隔离的策略,即产品是分层的,底下会有一个通用平台层,即各个行业都通用的技术组件,在这个平台层上,有不同行业团队去构建针对每个行业的场景和模型,与各个行业相匹配。”杨娟说。

市场:国内企业的超车机会

在关系型数据库领域,国外企业如Oracle、DB2因先发优势而具有较大优势,令国产关系型数据库行业的追赶周期相对较长。相比而言,图计算技术比较新,且国内外技术差距不大,令国内图数据库领域的追赶能力更强。

杨娟告诉记者,“尽管现在海外图数据库产品在国内占据较高市场份额,但国内相关产品正迅速兴起,且在某些技术环节具备较强竞争力。”

她分析指出:首先,多数海外图数据库产品仍是单机为主的技术架构,在分布式领域技术架构未必完善,无法在分布式环境下实现扩容,但国内众多图数据库研发平台基于云计算的分布式环境搭建新的技术架构,在分布式的高性能图计算方面具有一定领先性。

其次,基于国内企业需求的深入洞察与图计算技术迭代升级,国内图数据库企业在基础架构层设计、产品语言等方面也有一定前沿性。越来越多的国内金融机构与企业选择技术自主可控的图数据库企业合作,而后者通过与不同行业企业开展合作,产品性能得到更多打磨锤炼,业务空间得到进一步提升。

杨娟告诉记者,就近期参加的各种POC(Proof of concept,概念验证,针对客户具体应用的验证性测试)与评测分析,相比海外同行,海致的图数据库在不少性能方面表现更好。

在杨娟看来,超越欧美图数据库,形成新的竞争壁垒,国内企业必须在具体三大条件:一是,技术方面的深入洞察和前沿视野;二是,搭建卓越的技术研发团队,三是,与不同行业龙头企业开展合作,构建相关图数据库与图计算技术应用的“行业标准”。

据了解,海致今年参与了国际权威技术协会“关联数据基准委员会(LDBC)”立项的全球首个金融图数据库测试基准的编写,标准组成员还包括蚂蚁集团、Intel等国内外 6 家知名头部科技公司。

杨娟补充表示,国内大型互联网公司在图计算领域技术也有优势,但其技术、团队则与其主营业务紧密绑定,产品场景高度定制化。更多偏向2C端服务,因此与聚焦B端产品和服务的公司,并不存在诸多竞争。

“随着元宇宙产业的快速兴起,图能够更清晰的实现虚实映射,也是帮助数字人进行认知和思考的技术,我们也在探索图技术在元宇宙之中的应用以及发展空间。”杨娟说。

查看全文

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
2月前
|
关系型数据库 MySQL 数据库
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
|
2月前
|
存储 负载均衡 中间件
构建可扩展的分布式数据库:技术策略与实践
【8月更文挑战第3天】构建可扩展的分布式数据库是一个复杂而具有挑战性的任务。通过采用数据分片、复制与一致性模型、分布式事务管理和负载均衡与自动扩展等关键技术策略,并合理设计节点、架构模式和网络拓扑等关键组件,可以构建出高可用性、高性能和可扩展的分布式数据库系统。然而,在实际应用中还需要注意解决数据一致性、故障恢复与容错性以及分布式事务的复杂性等挑战。随着技术的不断发展和创新,相信分布式数据库系统将在未来发挥更加重要的作用。
|
3月前
|
监控 关系型数据库 MySQL
MySQL装机实战指南:从零开始构建高效数据库环境
通过本文的指南,您应该已经成功安装了MySQL,并对其进行了基本的配置和优化。MySQL是一个功能强大、灵活的数据库管理系统,通过不断的学习和实践,您将能够充分利用其潜力来满足您的业务需求。记住,定期备份数据库、更新软件以及进行性能监控是保持数据库环境健康和高效的关键。希望本文能对您有所帮助!
117 2
|
2月前
|
安全 Nacos 数据库
【技术安全大揭秘】Nacos暴露公网后被非法访问?!6大安全加固秘籍,手把手教你如何保护数据库免遭恶意篡改,打造坚不可摧的微服务注册与配置中心!从限制公网访问到启用访问控制,全方位解析如何构建安全防护体系,让您从此告别数据安全风险!
【8月更文挑战第15天】Nacos是一款广受好评的微服务注册与配置中心,但其公网暴露可能引发数据库被非法访问甚至篡改的安全隐患。本文剖析此问题并提供解决方案,包括限制公网访问、启用HTTPS、加强数据库安全、配置访问控制及监控等,帮助开发者确保服务安全稳定运行。
110 0
|
3月前
|
存储 自然语言处理 DataWorks
通过云上数据库三步构建RAG系统
本文介绍了如何使用OpenSearch LLM智能问答版通过云上数据库一站式构建RAG系统。
20076 10
|
3月前
|
存储 运维 NoSQL
现代化企业管理中的数据库选择与优化策略
在当今信息化时代,企业管理越来越依赖于高效的数据库系统来支撑业务运作。本文探讨了在选择和优化数据库时需要考虑的关键因素,包括数据类型、访问模式以及性能需求。通过分析不同数据库系统的特性和优劣势,帮助企业在面对日益复杂的业务需求时,选择合适的数据库解决方案,提升管理效率和业务运行质量。
|
3月前
|
SQL 自然语言处理 网络协议
【Linux开发实战指南】基于TCP、进程数据结构与SQL数据库:构建在线云词典系统(含注册、登录、查询、历史记录管理功能及源码分享)
TCP(Transmission Control Protocol)连接是互联网上最常用的一种面向连接、可靠的、基于字节流的传输层通信协议。建立TCP连接需要经过著名的“三次握手”过程: 1. SYN(同步序列编号):客户端发送一个SYN包给服务器,并进入SYN_SEND状态,等待服务器确认。 2. SYN-ACK:服务器收到SYN包后,回应一个SYN-ACK(SYN+ACKnowledgment)包,告诉客户端其接收到了请求,并同意建立连接,此时服务器进入SYN_RECV状态。 3. ACK(确认字符):客户端收到服务器的SYN-ACK包后,发送一个ACK包给服务器,确认收到了服务器的确
177 1
|
3月前
|
关系型数据库 分布式数据库 PolarDB
**PolarDB开源指南:构建分布式数据库集群**踏上PolarDB开源之旅,了解如何从零开始搭建分布式集群
【7月更文挑战第3天】**PolarDB开源指南:构建分布式数据库集群**踏上PolarDB开源之旅,了解如何从零开始搭建分布式集群。采用存储计算分离架构,适用于大规模OLTP和OLAP。先准备硬件和软件环境,包括Linux、Docker和Git。然后,克隆源码,构建Docker镜像,部署控制节点和计算节点。使用PDCli验证集群状态,开始探索PolarDB的高性能与高可用性。在实践中深化学习,贡献于数据库技术创新。记得在安全环境下测试。
168 1
|
4月前
|
SQL 存储 运维
网易游戏如何基于阿里云瑶池数据库 SelectDB 内核 Apache Doris 构建全新湖仓一体架构
随着网易游戏品类及产品的快速发展,游戏数据分析场景面临着越来越多的挑战,为了保证系统性能和 SLA,要求引入新的组件来解决特定业务场景问题。为此,网易游戏引入 Apache Doris 构建了全新的湖仓一体架构。经过不断地扩张,目前已发展至十余集群、为内部上百个项目提供了稳定可靠的数据服务、日均查询量数百万次,整体查询性能得到 10-20 倍提升。
网易游戏如何基于阿里云瑶池数据库 SelectDB 内核 Apache Doris 构建全新湖仓一体架构
|
4月前
|
存储 分布式数据库 数据库
深入OceanBase内部机制:分区构建高可用、高性能的分布式数据库基石
深入OceanBase内部机制:分区构建高可用、高性能的分布式数据库基石
下一篇
无影云桌面