NebulaGraph:打造灵活弹性的云原生图数据库,与阿里云计算巢共同拥抱开放生态

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 大数据时代,数据价值水涨船高,却很少有人提及,对于企业来说,从如山一般增长的数据中挖掘价值,到底意味着什么。

大数据时代,数据价值水涨船高,却很少有人提及,对于企业来说,从如山一般增长的数据中挖掘价值,到底意味着什么。


这是各行各业都存在的需求痛点。传统的关系型数据库并不擅长进行关联查询,无论是从效率还是运算速度上考虑,表连接的查询成本都是巨大的,且具有结构性的安全隐患。


“所有技术的发展,都离不开业务的需求。”


国内图数据库头部服务商「NebulaGraph」CEO叶小萌告诉36氪,图数据库等NoSQL数据库的诞生,本身就是为了解决关系型数据库在业务表达中的原生缺陷。图数据库以点代表实体,边代表实体之间的关系,能够更直观、更高效地存储和处理海量关联数据,在金融风控、欺诈检测、社交推荐、知识图谱等场景中都有广泛应用。


「NebulaGraph」母公司「悦数科技」成立于2018年,是一家专注于分布式图数据库,并在移动大数据、数据存储管理等领域拥有丰富研发和项目管理经验的技术型企业。并推出了云上超大规模图数据库「NebulaGraph Cloud」,实现了产品的云化。



分布式图数据库:结构灵活,弹性极致


早在2011年,Neo  Technology的开源数据库Neo4j就获得了1060万美元融资,宣告了图数据库的巨大价值潜力。而如今,使用图结构进行语义查询,已经被实践在更多的行业应用中。除了大众最为熟知的知识图谱和社交网络之外,个性化推荐、风险分析、身份验证、行业研究、AI、NLP(自然语言处理)等在大多数产业数字化过程中都至关重要的技术领域,也在见证图数据库的异军突起。


除了天然的多层关联关系分析能力之外,因为基于图模型,图数据库也具有天然的可解释性和更好的可视化能力。另一方面,由于点边分离,图数据库比关系型数据库更接近于人类直观的认知逻辑,并能够把这种关系思维更清晰地呈现出来。


技术迭代,一直都是一种朝着人性化迈进的主动选择。


从底层逻辑来分析数据库的核心原理,不难发现,数据库作为一种结构化的解决方案,其应用目的大多都是基于对现实世界中非结构化关系的高效表达。因此,在技术语言的简化、人性化趋势下,越能直接、自然地贴近现实场景下的节点关系网络,在插入更大数据量级的同时削弱计算本身的抽象化特性,也就越有机会迭代掉传统的主流框架,成为时下最流行的商业数据库。


不过,图数据库也存在一些痛点。比如,图查询语言的标准化(ISO-GQL)工作还在进行中。此外,尤其在国内市场,图数据库厂商多为初创型企业,在可规模化和多渠道打通能力上略显不足。在商业化阶段,「NebulaGraph」需要考虑的事情更多,包括更快速的部署实践用户体验和更高的安全标准。


为此,「NebulaGraph Cloud」似乎正在向我们印证,向云服务做集成,也许会是图数据库下一个发展阶段的答案。


作为国内分布式图数据库的标杆产品,「NebulaGraph」自身的一大优势来自于:采用了存储与计算分离的架构,支持终端用户计算层和存储层可以根据各自的情况弹性扩容。这使图数据库具有了云原生的特征,云端部署则能够有效地屏蔽了数据库部署、性能调优、运维等繁杂过程,同时带来“近乎无限”的极致弹性。


商业化阶段:开放与“云集成”


早在2005年左右,NebulaGraph 的核心研发团队就开始在国内外多个知名企业参与图数据库相关工作。2015 年,叶小萌正式加入蚂蚁金服,开始主导研发高性能分布式图数据库GeaBase。


彼时,一个令人兴奋的数据库世界开始生成。从Neo4j的成熟,到云数据仓库Snowflake的出现,尽管距离全球知名咨询机构Gartner宣布“图数据库已经成为当下数据分析的基础”还有六年左右的时间,但图数据库的市场早就已经准备好了随时爆发。


2019年,采用原生分布式架构的高性能图数据库「NebulaGraph」正式发布,继续在中国乃至全世界范围内推广图计算技术。根据中国信通院的预测,2025年,图分析在数据和分析创新中的占比将提升至80%。


在2013年开始成为数据库增速最快的子领域之前,图数据库已经经历了漫长的技术拓荒时期,而其真正的商业化历程也不过几年时间,还需要大量的时间和人为努力去给予想象力。


成立三年后,「NebulaGraph」开始做商业化,而在「NebulaGraph Cloud」上线阿里云计算巢后的短短几个月里,「NebulaGraph」已经增加了数十家试用用户,其中有相当一部分客户已经完成签约。


在国产图数据库等ToB软件走向商业化的过程中,前沿技术正在和云服务体验产生1+1>2的效果。无论是「NebulaGraph」所代表的新兴技术厂商,还是已经与各行各业的企服服务商展开了长期合作的阿里云计算巢,积极拥抱生态的开放性,既是顺应技术的结构性趋势,也是解决国内企服领域“圈地”现象的有效途径。


事实上,数据库本身就是一个开放程度很高的领域。随着技术应用的复杂化和行业人才流动加大,技术从业者对于框架的取舍直接决定着企业客户对于商业化解决方案的选择。叶小萌介绍道,「NebulaGraph」很多商业化的线索和实例都来自于社区。


开源降低了技术人员的体验成本,而对于更复杂、更大范围内的企业客户来说,最大的商业化成本在于初创厂商需要在长期的沟通和教育中,反复证明软件的安全性和可用性。同时,也能帮助有图数据库需求的企业实现应用人才的积累。从这一角度来说,阿里云作为国内最大的云服务平台,能够帮助「NebulaGraph」的目标客户通过自助服务的方式,来缩短从试用到购买的决策流程。


基于二者技术特点与服务特性的有机结合,「NebulaGraph Cloud」作为一款云原生图数据库产品可以为对于终端用户提供以下几个优势:



第一,自动化部署,大幅提升部署效率。阿里云提供了统一的基础设施,企业无需自行采购硬件,可以根据业务的灵活度和资源需求弹性调配云资源,实现快速上线。基于阿里云计算巢提供的ROS(资源编排),NebulaGraph实现了云上自动化部署,几分钟内即可交付一个图数据库集群,相比传统以天、甚至以周为单位的交付周期,有极大的提升。


第二,在计算巢平台上的高度集成,可以为最终用户提供更具性价比的方案。在用户私有部署的情况下,需要把数据库部署在一个具有强存储计算能力、价格昂贵的服务器上。但通过云的技术能力,利用阿里云提供的实例、对象存储等高性价比的云服务,能为最终客户提供一套极具性价比的解决方案。例如,基于全新的第四代AMD  EPYC处理器打造的阿里云g8a实例,可以为终端客户提供强劲算力,帮助客户加速业务创新、降本增效,持续为客户创造价值。


另一方面,通过云的弹性能力和「NebulaGraph」分布式特性的有机结合,用户在数据量增长过程中对集群规模进行扩容,也能够得到高性价比和稳定的服务。


第三,为用户提供更短的软件试用和决策路径。计算巢的软件免费试用中心,可以很好解决传统软件试用流程冗长、高试错成本的痛点,提供快速、开箱即用的云上应用新体验。在计算巢软件免费试用中心,用户可以直接试用NebulaGraph产品,节省了数周的审批和对接时间,为用户带来了更方便、快捷的一体化试用和决策流程,试用体验大大提升。


第四,更强的可用性和安全性。传统模式下,企业采购硬件资源,数据库部署在自建IDC并由企业监管和运维。接入业务后,企业IT人员需要时刻关注数据库集群状态来保障可用性,而云计算作为技术载体,天然具备跨越时空的优势。「NebulaGraph  Cloud」内置了多种角色,用户可以为指定图空间增加不同角色权限的数据库用户,保证业务数据安全。


数据价值挖掘:生于云,长于云


“云计算的本质是技术和开放。对于企业服务领域,云需要更加开放,通过技术手段成为伙伴发展的效率倍增器。”阿里云弹性计算产品线总经理张献涛表示,阿里云计算巢的愿景,是构建一个开放的企业服务应用生态,助力中国软件企业生于云、长于云,拥有持续的生命力。


这一生态性的目标,也与「NebulaGraph」的产品理念不谋而合。


“只有当软件分工越来越细化、标准化的时候,才能够更容易彼此集成在一起。”


同样地,在叶小萌看来,国内企服市场标准化、集成化的趋势必将来临。一致的前进方向成为了合作的驱动力,对软件应用生态的坚持也是「NebulaGraph」能够成为阿里云计算巢上第一家图数据库合作伙伴的重要原因。


如今,云计算正在从单一的计算能力发展为体系化的创新。对于企业来说,“上云”既是一个技术选择,也可以成为企业数字化的起点。


作为面向ISV(独立软件服务商)的云集成PaaS平台,阿里云计算巢致力于帮助技术厂商将产品和服务与云原生的能力相结合,从而提升软件服务在交付、部署、管理等环节的效率和用户体验。

Gartner研究显示,目前云服务的增速和渗透率十分可观,大量的商业软件正在从完全私有本地化服务逐步转向基于云服务的商业模式。对此,艾瑞数据亦有所证明:2021年,中国整体云服务市场规模达到了3280.2亿元  ,增速为45.4%。云服务目前在供给端已经形成较为稳固的市场格局,上云、用云也成为了需求侧的广泛共识。


在可以预见的未来,云原生图数据库能够从知识图谱、机器学习及模型优化、数据特征提取分析等多维的角度来与人工智能相结合,释放更大的数据力量,也是图数据库成为SaaS/DaaS产品的关键步骤。


“超出我们预期的是,对于「NebulaGraph Cloud」的用户,我们几乎没有像其他用户一样去深度参与他们的决策过程。”叶小萌着重强调了阿里云计算巢的高效试用及部署流程。在企业上云和企服软件云化的过程中,试用体验是最重要的指标之一。计算巢提供的POC免费试用中心,相比用户需要“手动提交申请、手动创建资源”的传统试用流程,更好地解决了试用流程冗长、高试错成本的痛点,真正做到了自动化部署下的开箱即用。 「NebulaGraph」作为计算巢上首批开通免费试用的服务商之一,也已经充分感受到了其作为企业云化“切入口”的效率与体验价值。


数据关联和价值挖掘的挑战,属于每一家企业。而「NebulaGraph Cloud」也将借助阿里云计算巢,一起帮助企业基于云构建新的数据价值机会,让数据更好地生于云,长于云。

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
27天前
|
关系型数据库 分布式数据库 数据库
成都晨云信息技术完成阿里云PolarDB数据库产品生态集成认证
近日,成都晨云信息技术有限责任公司(以下简称晨云信息)与阿里云PolarDB PostgreSQL版数据库产品展开产品集成认证。测试结果表明,晨云信息旗下晨云-站群管理系统(V1.0)与阿里云以下产品:开源云原生数据库PolarDB PostgreSQL版(V11),完全满足产品兼容认证要求,兼容性良好,系统运行稳定。
|
1月前
|
缓存 安全 Java
阿里云数据库 SelectDB 内核 Apache Doris 2.0.6 版本正式发布
阿里云数据库 SelectDB 内核 Apache Doris 2.0.6 版本正式发布
|
1月前
|
存储 NoSQL 数据库
阿里云数据库Cassandra的产品价格
阿里云数据库Cassandra提供多地域服务,如中国、亚太、欧洲、美洲及中东。计费分为实例主机节点规格费和存储费用,实例价格因节点数和副本数而异,存储费用按挂载云盘计算。生产系统建议配置多节点以确保冗余。公网流量目前免费,具体收费时间未定。详细价格以购买页面为准。
421 3
|
1月前
|
SQL 关系型数据库 MySQL
2024年阿里云数据库创建_数据库账号密码和连接教程
阿里云数据库怎么使用?阿里云百科整理阿里云数据库从购买到使用全流程,阿里云支持MySQL、SQL Server、PostgreSQL和MariaDB等数据库引擎,阿里云数据库具有高可用、高容灾特性,阿里云提供数据库备份、恢复、迁移全套解决方案。详细阿里云数据库购买和使用流程方法如下
|
1月前
|
人工智能 监控 Cloud Native
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
|
1月前
|
SQL 安全 数据管理
在阿里云数据管理DMS(Data Management Service)中,您可以按照以下步骤来创建和管理数据库
【2月更文挑战第33天】在阿里云数据管理DMS(Data Management Service)中,您可以按照以下步骤来创建和管理数据库
37 7
|
1天前
|
Cloud Native Serverless 开发者
阿里云助力开发者创新:探索云原生技术的新境界
阿里云开发者社区推动云原生技术发展,提供丰富产品(如容器服务、Serverless、微服务架构、服务网格)与学习平台,助力企业数字化转型。开发者在此探索实践,共享资源,参与技术活动,共同创新,共创云原生技术新篇章。一起加入,开启精彩旅程!
37 2
|
15天前
|
消息中间件 人工智能 监控
|
22天前
|
弹性计算 关系型数据库 MySQL
阿里云数据库服务器价格表,数据库创建、连接和使用教程
阿里云数据库使用流程包括购买和管理。选择所需数据库类型如MySQL,完成实名认证后购买,配置CPU、内存和存储。确保数据库地域与ECS相同以允许内网连接。创建数据库和账号,设置权限。通过DMS登录数据库,使用账号密码连接。同一VPC内的ECS需添加至白名单以进行内网通信。参考官方文档进行详细操作。
123 3
|
22天前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
200 1