DataStax引入图形DB Titan何去何从?

简介:

DataStax正式引入一款Cassandra NoSQL数据库引擎和一款图形DB,它们将致力于促进这些软件在应用程序跨越事务处理和实时分析中的使用。

该公司的新产品采用了DataStax Enterprise(DSE)5.0的形式。它还结合了一款更新后的Cassandra列家族存储,且该存储使用了Titan图形数据库的开源版本,DataStax将之形容为彻底地重写。

该版本还增加了选择性复制,旨在更好地支持出现在物联网和零售应用程序中的星型拓扑结构。同样,新型多实例服务器自动化有益于某些数据中心管理员,而比起大型分布式集群,这些管理员更喜欢大型个人机。

ProtectWise公司是位于Denver的一家网络安全服务提供商,对于其联合创始人兼CTO Gene Stevens来说,DSE基于Cassandra的软件是迈向新一代大数据安全分析的一步。

Stevens说,ProtectWise正在一个安全系统上使用DSE和它的Spark连接器,该系统每天可以录入200亿条记录,而且在高峰期可以每秒处理数百万条记录。历史活动迹象先于安全漏洞出现,对此进行研究的数据科学家同样在使用该系统。看大数据走向的最佳方式就是去描绘一幅拥有无限数据流的未来图景。

“我们正在做的是远离面向批处理的分析方法,转向一种流处理,面向时间序列的方法。用Cassandra这样的产品让以上转变成为可能,”他说。

在采用计划早期

迄今为止,DataStax的Cassandra版本已经在大量NoSQL数据库中标记了某些独特的空间。对于一个系统来说,它已经演化并结合了多种元素,包括键值存储,文档取向和列格式的分布式数据处理,而且在云中尤为如此,而大容量的高速网络应用程序已经成为这样系统的最佳契合点。

该公司还是NoSQL的早期参与者,它建立了一个与Apache Spark分析引擎的连接器。该连接在所有类型的NoSQL数据库中变得越来越普遍。

虽然远离原来的开源Cassandra根基是另外一个阶段,但是将分布式Titan图形软件紧密连接至Cassandra存储能够进一步扩大DSE的作用。在Titan-Cassandra应用的领域可能会发现这样的应用程序,它们包含访问控制,网络分析和风险分析。在这每一个领域中,实时分析应用程序都与Cassandra的操作端处理紧密结合。

Stevens表示,ProtectWise对DSE的使用尚未扩展至图形数据库,但也为时不远。“图形DB高度适用于网络安全,而且对于异常检测有着大量的需求,”他说。“我们处在一个早期采用计划之中。”

图形DB开始为人所理解

图形DB已经在欺诈检测和推荐引擎中找到了用武之地,Nick Heudecker的分析师Gartner说,因为这些情况是公司现在想要非常接近实时做出决策的地方。“图形便是解决该问题的途径之一,”他说。

奇怪的是,或许比起以关系命名的关系型数据库,图形数据库通常能够更容易对关系数据进行快速处理。

“关系型数据库要求引用完整性,而图形数据库则要求关系,”Heudecker说。

但是,除了一套基本的用例,对图形数据库而言,道路仍是曲折艰苦的,Heudecker说。

“图形正变得越来越普遍,但是很多可能的用例才刚刚开始为人所理解,”他说。

在相同平台上将图形模型作为键值存储进行处理,或是给一个关系型平台添加JSON NoSQL文档支持,两者都至少会有一个共同的结果。“在一个单独的封装内将数据处理不同的模型放在一起可以简化管理,”他说。

Titan将何去何从?

在去年早些时候DataStax收购了Aurelius LLC,获得了强大的发展势头,而DataStax的发版则是真正的高潮。该公司的领导层那时正指引着开源Titan图形数据库的开发。

Titan是最早的分布式图形数据库之一,它解决了一个图形要如何才能在分布式模型上运行的问题。而且它还是与文件无关的。“但这总是根据编码的最小公分母提出问题,”DataStax的工程副总Martin Van Ryswyk如是说。

目前的DSE图形引擎灵感来自于Titan,但是新的设计有了显著的变化,其中很多是关于改进Titan如何与Cassandra协同工作的,Van Ryswyk说,“这完全是重写,灵感来自于Titan,但是它与我们的闭源系统紧密相连。”

对于图形数据多样性的开源举措来说,Van Ryswyk认为Gremlin作为一个区域,DataStax会寻求支持。这是一款用于图形数据库开发的语言。“对于跨越很多系统来说拥有一款通用图形语言是很有价值的,对竞争对手同样如此,”Van Ryswyk说。

Van Ryswyk认为DataStax对于Cassandra和Tian以及Cassandra和Solr(一款开源搜索平台)的集成会缓解用户的开发和管理负担。对于DataStax在ProtectWise的客户Gene Stevens来说,这是非常重要的附加价值。

他说,“我们以开源的Cassandra作为开始。但是让Cassandra和Solr作为单独的系统,并且保持它们的同步是非常困难的。DSE是和它们紧密结合的。”他补充说,面对原生Cassandra时,DataStax的实现帮助解决了很多低级集成和编程方面的琐事。

DataStax押注的是将图形数据库与Cassandra紧密结合会赢得像Steven这种正在面对无限数据流处理和分析的客户。

在匆忙实现图形数据库的过程中,DataStax并不孤单。其他面向图形数据库的后期活动包括Neo Technology对Neo4j 3.0的重新设计,旨在获得更高的可扩展性;TIBCO Software Inc.在社区评论版开放其TIBCO Graph Database入口;以及IBM准备在Bluemix上提供一般可用的图形数据库。同样值得注意的是,图形数据库在供应商产品中的兴起,而这些产品的目标是数据湖和主数据管理。





====================================分割线================================


本文转自d1net(转载)

目录
相关文章
|
2月前
|
数据库
Google Earth Engine(GEE)——全球树木异体测量和树冠结构(Tallo)数据库
Google Earth Engine(GEE)——全球树木异体测量和树冠结构(Tallo)数据库
19 1
|
1月前
|
UED
首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
【2月更文挑战第13天】首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
38 3
首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
|
2月前
|
编解码 人工智能 算法
Google Earth Engine(GEE)——高度可扩展的时间自适应反射率融合模型(HISTARFM)数据库
Google Earth Engine(GEE)——高度可扩展的时间自适应反射率融合模型(HISTARFM)数据库
42 0
|
11月前
|
机器学习/深度学习 人工智能 测试技术
神经引擎这回行了吗?iPhone 14 Core ML性能测评已出
神经引擎这回行了吗?iPhone 14 Core ML性能测评已出
136 0
|
12月前
|
消息中间件 缓存 NoSQL
从美团挖来的架构师居然这么设计DB+缓存,真的长见识了!
从美团挖来的架构师居然这么设计DB+缓存,真的长见识了!
|
编解码 Shell Linux
使用GFS数据驱动WRF模式场--2层嵌套 全过程学习记录
使用GFS数据驱动WRF模式场--2层嵌套 全过程学习记录
使用GFS数据驱动WRF模式场--2层嵌套 全过程学习记录
|
存储 人工智能 自然语言处理
解密openGauss DB4AI框架的内部机理
1. openGauss AI框架的特点 DB4AI这个方向中,数据库通过集成AI能力,在用户进行AI计算时就可以避免数据搬运的问题。不同于其他的DB4AI框架,本次openGauss开源的原生框架是通过添加AI算子的方式完成数据库中的AI计算。 那么除了避免了数据搬运所带来的问题这个普遍优势,openGauss的AI框架还具有以下的优势和特点: 1)极低的学习门槛 当前最主流的计算框架:Tensorflow、pytorch、keras等大多依托于python语言作为构建的脚本语言,虽然python已经足够的简单易学但还是需要一定的学习成本。而当前的框架,设计提供了CREATE MOD
260 1
|
编解码 安全 数据挖掘
Google Earth Engine(GEE)——2015-2019年100米分辨率的动态土地覆盖数据集(CGLS-LC100)
Google Earth Engine(GEE)——2015-2019年100米分辨率的动态土地覆盖数据集(CGLS-LC100)
216 0
Google Earth Engine(GEE)——2015-2019年100米分辨率的动态土地覆盖数据集(CGLS-LC100)
|
传感器 编解码 知识图谱
Google Earth Engine ——MYD17A2H/A3H/GF V6总初级生产力(GPP)产品是一个具有500米分辨率的8天/16天累积综合数据。
Google Earth Engine ——MYD17A2H/A3H/GF V6总初级生产力(GPP)产品是一个具有500米分辨率的8天/16天累积综合数据。
189 0
Google Earth Engine ——MYD17A2H/A3H/GF V6总初级生产力(GPP)产品是一个具有500米分辨率的8天/16天累积综合数据。
|
编解码 知识图谱
Google Earth Engine ——MOD17A3HGF.006: MOD17A3HGF V6产品提供500米像素分辨率的年度净初级生产力(NPP)Yearly Global 500m
Google Earth Engine ——MOD17A3HGF.006: MOD17A3HGF V6产品提供500米像素分辨率的年度净初级生产力(NPP)Yearly Global 500m
443 0
Google Earth Engine ——MOD17A3HGF.006: MOD17A3HGF V6产品提供500米像素分辨率的年度净初级生产力(NPP)Yearly Global 500m