图数据库浅谈

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 图数据库分为两大类:native graph和non-native graphnative graph:数据只能存放在一台机器上。不支持分片。如果你的数据量非常大,Neo4j是扛不住的。

图数据库分为两大类:native graph和non-native graph

native graph:

数据只能存放在一台机器上。不支持分片。如果你的数据量非常大,Neo4j是扛不住的。
它的优点是读写速度都非常快,查关系也非常快。
典型代表是Neo4j。网上查了很久,Neo4j的团队认为你应该只把最重要的数据存到图里。Neo4j不愿意牺牲速度。因为目前图数据库分片是一个NP complete的问题。他们说与其实现一个naive(幼稚的)分片,不如把速度搞好。显然这是冲着数据分析来的。速度上来了,配合spark,分析数据就更快了,这样才有可能挖掘出更有价值的数据。

non-ative graph:

数据可以存储在多台机器上。支持分片(partition/sharding)。这个自然是冲着大数据来的。好处是不用担心一台机器硬盘的容量不够了,坏处是牺牲了性能。
这一类的图数据库有titan,orly,cayley。

titan的backend可以配置成Hbase或者Cassandra,可以做到分片。

cayley如果backend配置的是分布式的mongo的话,也能做到分片。

orly不依赖第三方backend。直接做到分片,并且声称性能还很好。

虽然支持分片,但其实titan和cayley只是一个graph layer。因为他们底层依赖其他存储系统。既然是graph layer,有人就质疑说titan和cayley能否称得上真正的图数据库。titan和orly做的挺好,都被收购了,然后就死掉了。github上很久没人更新了。目前也只能寄希望于cayley了。这个是go语言写的。社区也很活跃。

插一段废话:
我不懂大数据,更不懂数据挖掘。只能谈谈自己的一点理解。
零散的数据没什么价值,但是一旦把数据关联起来,即便是看起来是垃圾数据也可能会得出非常有价值的结论。怎么关联?抽取实体,建立关系,抽象出模型。据说行话叫构建知识图谱。然后从关联的数据量找出有价值的东西。这需要对数据极度敏感,智力还要好。这种活我们这些小程序员可干不了,得数学家和科学家来。科学家是大朋友,我们只是小朋友。小朋友可以很容易培养,科学家却不可多得。李开复说的,我觉得说的很有道理。我们能做什么?做大数据采集。做爬虫也好,做大数据存储也好都是为数据挖掘的人服务的。哦,对了,怎么挖掘数据?我也不知道,大概是机器学习,深度学习吧。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
相关文章
|
11月前
|
存储 NoSQL 关系型数据库
浅谈图数据库
浅谈图数据库
153 0
|
存储 NoSQL Java
|
存储 NoSQL 数据可视化
图数据库 - 概述
# 背景 关系型数据库自上世纪80年代以来一直都是数据库领域发展的主力,随着社交、物联网、金融、电商等领域的快速发展,由此产生的数据规模和数据间的关系复杂度呈现指数级的增长,而传统的关系型数据库在处理复杂关系的数据上表现很差,这是因为关系型数据库是通过外键索引来实现多表之间的关系引用的,查询实体之间的关系需要JOIN操作,而JOIN操作通常非常耗时,因此我们需要一种新的数据组织和查询方式,帮助我们
图数据库 - 概述
|
存储 分布式计算 NoSQL
聊聊图数据库和图数据库的小知识 Vol.02
在第二期的图数据库小知识中,我们回顾了图数据库的兴起契机,聊了聊【传统数据库通过设计良好的数据结构是不是可以实现图数据库的功能】、【图数据库会出于什么考虑做存储计算分离】等图数据库设计问题…
1293 0
|
存储 NoSQL 数据可视化
聊聊图数据库和图数据库的小知识
图数据库计算存储分离设计及该设计模式的考量原因、图数据库 0 标签的意义等图数据库相关问题
2493 0
|
存储 大数据 Apache
越来越火的图数据库究竟是什么?
如果把传统关系型数据库比作火车,那图数据库就是如今大数据时代的高铁。那究竟什么是图数据库呢?来不及解释了,先上车!~
3525 0
|
新零售 分布式数据库 数据库
图数据库HGraphDB介绍
一、HGraphDB概述图无处不在,社交和电商领域每天都会产生大量的实体连接数据,而描述图的方式往往是使用包括顶点和边以及丰富的属性的属性图来展现。在如今的2018年,社交网络和电商数据往往能够形成非常大的实体图,包括数十亿顶点和百亿条边这样的数据量。
6703 0
|
JSON 关系型数据库 数据库
图数据库:AgensGraph
非常流行的图数据库
3745 0
|
NoSQL 数据库 数据中心