持续九年,国际排名第一的宽表数据库概述|学习笔记

简介: 快速学习持续九年,国际排名第一的宽表数据库概述

开发者学堂课程【Cassandra数据库入门与实战持续九年,国际排名第一的宽表数据库概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/784


持续九年,国际排名第一的宽表数据库概述

我们正处在一个数据爆炸式增长的时代,随着5g,AI Iot等新兴技术和场景的出现,将加剧数据暴增,数据类型呈现多样化,关系型数据KV、宽表、文档、时序、图数据库等。

这些需求将对数据库领域带来新的挑战,如海量终端及数据导致的高并发、低延时、无线扩展、在线分析、极致可靠性等。

而cassandra就是这样一款,不仅能很好的满足现有应用,又是面向未来,可解决这些新问题的数据库,她也是一款国际上非常流行的数据库,过去12年里,在苹果、脸书、网飞、360、华为等很多国际化大公司都被应用在关键应用场景,在全球上万家企业,也有大规模成熟应用,

一、Apache Cassandra介绍

1、为什么要使用cassandra?

(1)分布式的海量数据储存和处理

(2)极高的性能

(3)极致的可靠性(去中心化的架构,无单点故障)

(4)优秀的线性可扩展能力

(5)对多地多数据中心部署的原生支持

(6)运维和管理需要理解的概念简单

(7)使用对开发者非常友好的类SQL语言CQL

(8)强大的生态,活跃的国际社区

(9)不断紧跟最新技术趋势,使他持续具有强大的生命力

二、学习cassandra的好处

(1)著名招聘网站DICE的年度工资调查,Cassandra一直被列为IT行业十大平均薪酬水平最高的技术之一

(2)对分布式系统的理解和动手能力—校招面试必杀技

(3)跟社区高手学习和交流

(4)提高你在职场的竞争力

二、DBEngine宽表数据库排名第一

4、国际社区的一些统计数据

Fortune前100强的企业90%都在使用cassandra

Linkedln上已有78000 cassandra专业人士,年增长率20%

72%的公司预计今年NoSQL使用会增加

186%增长C docker pulls

167490注册人员—DataStax Academy学院

三、构架基础和原理篇

1、Cassandra的起源

image.png

2、线性扩展

需要增加存储容量?

需要更多的数据吞吐量?

只要增加节点就好了!

3、Scale up垂直扩展和Scale out水平扩展

(1)垂直扩展需要增加单击硬件资源,最后单机的配置非常昂贵。

(2)水平扩展使用便宜得多的普通硬件资源不够了,只需要加更多的节点就好了。

4、数据是分布式储存的

5、Cassandra环的工作原理

image.png

在这个例子里,每一个节点负责一个范围,17号节点负责0到16,33号节点负责17到32,50号节点负责33到49,以此类推。

6、Cassandra多副本


image.png

7、节点故障

image.png

8、节点故障—恢复

image.pngimage.jpeg

9、数据的分布可以无处不在

10、CAP定理

image.png

11、Consistency Levels,一致性级别通常缩写为CL

image.png

我们在生态环境里边,大多数情况下,我们都会使用RF=3,对于刚开始使用Consistency的人来说,我们建议在生态环境中把复制因子设置为3,让数据库在高可用,高性能之间达到一个最佳的平衡,如果在将来,面对比较特殊的场景,可以考虑换成其他的复制因子。

image.png

四、应用场景

1、理解cassandra的应用场景

image.png

首先如果是需要数据库弹性扩展的需求,数据是海量、高吞吐量,有大量的写操作和读操作,像物联网这种应用场景,选择cassandra就是一种完美的选择。

如果需要数据库是高可用性,比如关键任务是不可以有数据丢失的,必须每一秒都在线,也非常适合用Cassandra。

2、各个行业的世界知名品牌都在使用Cassandra

3、典型的应用场景

image.png

4、苹果 部署规模

5、Facebook/Instagram应用案例

6、纽约证券交易—所每天发生三十六亿手股票交易

五、趋势发展

1、面向未来的数据架构

image.pngimage.jpeg

我们现在正在设计一个面向未来的一种数据架构,这个核心还可以是cassandra,在这个基础之上,我们希望应用程序和开发语言,能够解放出来,能够让他们使用他们最拿手的应用

相关文章
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云PolarDB登顶2024中国数据库流行榜:技术实力与开发者影响力
近日,阿里云旗下的自研云原生数据库PolarDB在2024年中国数据库流行度排行榜中夺冠,并刷新了榜单总分纪录,这一成就引起了技术圈的广泛关注。这一成就源于PolarDB在数据库技术上的突破与创新,以及对开发者和用户的实际需求的深入了解体会。那么本文就来分享一下关于数据库流行度排行榜的影响力以及对数据库选型的影响,讨论PolarDB登顶的关键因素,以及PolarDB“三层分离”新版本对开发者使用数据库的影响。
77 3
阿里云PolarDB登顶2024中国数据库流行榜:技术实力与开发者影响力
|
2月前
|
Cloud Native 关系型数据库 分布式数据库
2024最新一期中国数据库流行榜公布:阿里云PolarDB登顶
PolarDB登顶国产数据库流行榜,持续引领云原生数据库创新
2024最新一期中国数据库流行榜公布:阿里云PolarDB登顶
|
5月前
|
存储 监控 关系型数据库
传统库分表麻烦查询慢?TDengine 如何解决“搜狐基金”的应用难题
搜狐基金团队使用的 MySQL 数据库在面对海量数据时存在能力瓶颈,在此背景下,其决定基于 TDengine 尝试一下全新的方案。
105 0
|
SQL 人工智能 NoSQL
持续九年,国际排名第一的宽表数据库概述|学习笔记
快速学习持续九年,国际排名第一的宽表数据库概述
150 0
持续九年,国际排名第一的宽表数据库概述|学习笔记
|
数据库
《持续9年国际排名第一的宽表数据库概述》电子版地址
持续9年国际排名第一的宽表数据库概述
60 0
《持续9年国际排名第一的宽表数据库概述》电子版地址
|
存储 Cloud Native NoSQL
赛题解析 | 第四届全球数据库大赛——赛道1: 云原生共享内存数据库性能优化
第四届全球数据库大赛—PolarDB性能挑战赛,瓜分40万奖金池,只等你来!各赛道TOP10都可获得现金奖励
637 0
赛题解析 | 第四届全球数据库大赛——赛道1: 云原生共享内存数据库性能优化
|
数据采集 安全 关系型数据库
电信行业数据库能力测评“场景榜单”发布!
阿里云PolarDB支撑电信业务综合能力排名行业第一
272 0
电信行业数据库能力测评“场景榜单”发布!
|
SQL Cloud Native Oracle
开放下载 |《数据库:从趋势到实践》
2020年数据库年度顶级盛会DTCC演讲精华呈现,9位阿里云技术大咖带你领略前沿趋势、技术干货、最佳实践,独家内容一网打尽,普惠数据库开发者!
开放下载 |《数据库:从趋势到实践》
|
人工智能 安全 数据挖掘
1526万 QphH !蚂蚁自研数据库 OceanBase 登顶 TPC-H 权威榜单
这一次,OceanBase 拿下 TPC-C 和 TPC-H 双料第一
1526万 QphH !蚂蚁自研数据库 OceanBase 登顶 TPC-H 权威榜单