大数据时代,数据价值水涨船高,却很少有人提及,对于企业来说,从如山一般增长的数据中挖掘价值,到底意味着什么。
这是各行各业都存在的需求痛点。传统的关系型数据库并不擅长进行关联查询,无论是从效率还是运算速度上考虑,表连接的查询成本都是巨大的,且具有结构性的安全隐患。
“所有技术的发展,都离不开业务的需求。”
国内图数据库头部服务商「NebulaGraph」CEO叶小萌告诉36氪,图数据库等NoSQL数据库的诞生,本身就是为了解决关系型数据库在业务表达中的原生缺陷。图数据库以点代表实体,边代表实体之间的关系,能够更直观、更高效地存储和处理海量关联数据,在金融风控、欺诈检测、社交推荐、知识图谱等场景中都有广泛应用。
「NebulaGraph」母公司「悦数科技」成立于2018年,是一家专注于分布式图数据库,并在移动大数据、数据存储管理等领域拥有丰富研发和项目管理经验的技术型企业。并推出了云上超大规模图数据库「NebulaGraph Cloud」,实现了产品的云化。
一、分布式图数据库:结构灵活,弹性极致
早在2011年,Neo Technology的开源数据库Neo4j就获得了1060万美元融资,宣告了图数据库的巨大价值潜力。
而如今,使用图结构进行语义查询,已经被实践在更多的行业应用中。除了大众最为熟知的知识图谱和社交网络之外,个性化推荐、风险分析、身份验证、行业研究、AI、NLP(自然语言处理)等在大多数产业数字化过程中都至关重要的技术领域,也在见证图数据库的异军突起。
除了天然的多层关联关系分析能力之外,因为基于图模型,图数据库也具有天然的可解释性和更好的可视化能力。另一方面,由于点边分离,图数据库比关系型数据库更接近于人类直观的认知逻辑,并能够把这种关系思维更清晰地呈现出来。 技术迭代,一直都是一种朝着人性化迈进的主动选择。
从底层逻辑来分析数据库的核心原理,不难发现,数据库作为一种结构化的解决方案,其应用目的大多都是基于对现实世界中非结构化关系的高效表达。
因此,在技术语言的简化、人性化趋势下,越能直接、自然地贴近现实场景下的节点关系网络,在插入更大数据量级的同时削弱计算本身的抽象化特性,也就越有机会迭代掉传统的主流框架,成为时下最流行的商业数据库。
不过,图数据库也存在一些痛点。比如,图查询语言的标准化(ISO-GQL)工作还在进行中。此外,尤其在国内市场,图数据库厂商多为初创型企业,在可规模化和多渠道打通能力上略显不足。在商业化阶段,「NebulaGraph」需要考虑的事情更多,包括更快速的部署实践用户体验和更高的安全标准。
为此,「NebulaGraph Cloud」似乎正在向我们印证,向云服务做集成,也许会是图数据库下一个发展阶段的答案。
作为国内分布式图数据库的标杆产品,「NebulaGraph」自身的一大优势来自于:采用了存储与计算分离的架构,支持终端用户计算层和存储层可以根据各自的情况弹性扩容。这使图数据库具有了云原生的特征,云端部署则能够有效地屏蔽了数据库部署、性能调优、运维等繁杂过程,同时带来“近乎无限”的极致弹性。
二、商业化阶段:开放与“云集成”
早在2005年左右,NebulaGraph 的核心研发团队就开始在国内外多个知名企业参与图数据库相关工作。2015 年,叶小萌正式加入蚂蚁金服,开始主导研发高性能分布式图数据库GeaBase。
彼时,一个令人兴奋的数据库世界开始生成。从Neo4j的成熟,到云数据仓库Snowflake的出现,尽管距离全球知名咨询机构Gartner宣布“图数据库已经成为当下数据分析的基础”还有六年左右的时间,但图数据库的市场早就已经准备好了随时爆发。
2019年,采用原生分布式架构的高性能图数据库「NebulaGraph」正式发布,继续在中国乃至全世界范围内推广图计算技术。根据中国信通院的预测,2025年,图分析在数据和分析创新中的占比将提升至80%。
在2013年开始成为数据库增速最快的子领域之前,图数据库已经经历了漫长的技术拓荒时期,而其真正的商业化历程也不过几年时间,还需要大量的时间和人为努力去给予想象力。
成立三年后,「NebulaGraph」开始做商业化,而在「NebulaGraph Cloud」上线阿里云计算巢后的短短几个月里,「NebulaGraph」已经增加了数十家试用用户,其中有相当一部分客户已经完成签约。
在国产图数据库等ToB软件走向商业化的过程中,前沿技术正在和云服务体验产生1+1>2的效果。无论是「NebulaGraph」所代表的新兴技术厂商,还是已经与各行各业的企服服务商展开了长期合作的阿里云计算巢,积极拥抱生态的开放性,既是顺应技术的结构性趋势,也是解决国内企服领域“圈地”现象的有效途径。
事实上,数据库本身就是一个开放程度很高的领域。随着技术应用的复杂化和行业人才流动加大,技术从业者对于框架的取舍直接决定着企业客户对于商业化解决方案的选择。叶小萌介绍道,「NebulaGraph」很多商业化的线索和实例都来自于社区。
开源降低了技术人员的体验成本,而对于更复杂、更大范围内的企业客户来说,最大的商业化成本在于初创厂商需要在长期的沟通和教育中,反复证明软件的安全性和可用性。同时,也能帮助有图数据库需求的企业实现应用人才的积累。从这一角度来说,阿里云作为国内最大的云服务平台,能够帮助能够帮助「NebulaGraph」的目标客户通过自助服务的方式,来缩短从试用到购买的决策流程。
基于二者技术特点与服务特性的有机结合,「NebulaGraph Cloud」作为一款云原生图数据库产品可以为对于终端用户提供以下几个优势:
第一,自动化部署,大幅提升部署效率。阿里云提供了统一的基础设施,企业无需自行采购硬件,可以根据业务的灵活度和资源需求弹性调配云资源,实现快速上线。基于阿里云计算巢提供的ROS(资源编排),NebulaGraph实现了云上自动化部署,几分钟内即可交付一个图数据库集群,相比传统以天、甚至以周为单位的交付周期,有极大的提升。
第二,在计算巢平台上的高度集成,可以为最终用户提供更具性价比的方案。在用户私有部署的情况下,需要把数据库部署在一个具有强存储计算能力、价格昂贵的服务器上。但通过云的技术能力,利用阿里云提供的实例、对象存储等高性价比的云服务,能为最终客户提供一套极具性价比的解决方案。例如,基于全新的第四代AMD EPYC处理器打造的阿里云g8a实例,可以为终端客户提供强劲算力,帮助客户加速业务创新、降本增效,持续为客户创造价值。另一方面,通过云的弹性能力和「NebulaGraph」分布式特性的有机结合,用户在数据量增长过程中对集群规模进行扩容,也能够得到高性价比和稳定的服务。
第三,为用户提供更短的软件试用和决策路径。计算巢的软件免费试用中心,可以很好解决传统软件试用流程冗长、高试错成本的痛点,提供快速、开箱即用的云上应用新体验。在计算巢软件免费试用中心,用户可以直接试用NebulaGraph产品,节省了数周的审批和对接时间,为用户带来了更方便、快捷的一体化试用和决策流程,试用体验大大提升。
第四,更强的可用性和安全性。传统模式下,企业采购硬件资源,数据库部署在自建IDC并由企业监管和运维。接入业务后,企业IT人员需要时刻关注数据库集群状态来保障可用性,而云计算作为技术载体,天然具备跨越时空的优势。「NebulaGraph Cloud」内置了多种角色,用户可以为指定图空间增加不同角色权限的数据库用户,保证业务数据安全。
三、数据价值挖掘:生于云,长于云
“云计算的本质是技术和开放。对于企业服务领域,云需要更加开放,通过技术手段成为伙伴发展的效率倍增器。”阿里云智能基础产品部副总裁、阿里云智能弹性计算&无影产品线总经理张献涛表示,阿里云计算巢的愿景,是构建一个开放的企业服务应用生态,助力中国软件企业生于云、长于云,拥有持续的生命力。
这一生态性的目标,也与「NebulaGraph」的产品理念不谋而合。
“只有当软件分工越来越细化、标准化的时候,才能够更容易彼此集成在一起。” 同样地,在叶小萌看来,国内企服市场标准化、集成化的趋势必将来临。一致的前进方向成为了合作的驱动力,对软件应用生态的坚持也是「NebulaGraph」能够成为阿里云计算巢上第一家图数据库合作伙伴的重要原因。
如今,云计算正在从单一的计算能力发展为体系化的创新。对于企业来说,“上云”既是一个技术选择,也可以成为企业数字化的起点。
作为面向ISV(独立软件服务商)的云集成PaaS平台,阿里云计算巢致力于帮助技术厂商将产品和服务与云原生的能力相结合,从而提升软件服务在交付、部署、管理等环节的效率和用户体验。
Gartner研究显示,目前云服务的增速和渗透率十分可观,大量的商业软件正在从完全私有本地化服务逐步转向基于云服务的商业模式。对此,艾瑞数据亦有所证明:2021年,中国整体云服务市场规模达到了3280.2亿元 ,增速为45.4%。云服务目前在供给端已经形成较为稳固的市场格局,上云、用云也成为了需求侧的广泛共识。
在可以预见的未来,云原生图数据库能够从知识图谱、机器学习及模型优化、数据特征提取分析等多维的角度来与人工智能相结合,释放更大的数据力量,也是图数据库成为SaaS/DaaS产品的关键步骤。
“超出我们预期的是,对于「NebulaGraph Cloud」的用户,我们几乎没有像其他用户一样去深度参与他们的决策过程。”叶小萌着重强调了阿里云计算巢的高效试用及部署流程。
在企业上云和企服软件云化的过程中,试用体验是最重要的指标之一。计算巢提供的POC免费试用中心,相比用户需要“手动提交申请、手动创建资源”的传统试用流程,更好地解决了试用流程冗长、高试错成本的痛点,真正做到了自动化部署下的开箱即用。 「NebulaGraph」作为计算巢上首批开通免费试用的服务商之一,也已经充分感受到了其作为企业云化“切入口”的效率与体验价值。
数据关联和价值挖掘的挑战,属于每一家企业。而「NebulaGraph Cloud」也将借助阿里云计算巢,一起帮助企业基于云构建新的数据价值机会,让数据更好地生于云,长于云。