云HBase集群的规划

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: 在服务客户的时候,经常会被问到,我该选择什么配置的HBase呢?今天我们就来好好谈谈这个问题。

概述

在服务客户的时候,经常会被问到,我该选择什么配置的HBase呢?今天我们就来好好谈谈这个问题,希望能说清楚

基本架构

目前云HBase的基本架构为:
image
从架构图中,可以看出Master是主备的,且不存任何业务数据的;core节点至少2台,第一个节点为了节约节点,部署了一个zk,Core节点可以一直添加到100或者500个节点左右。

Master节点选择

Master节点的规格:2cpu4g起步,主要看集群的规格。参考以下的配置

core的规模 master选择
<=4台 2cpu4g
4台 4cpu8g
10 8cpu16g
20 16cpu32g
50 16cpu64g

Core节点选择

core阶段选择:4cpu8g起步,最大32cpu128g
以1KB为准:

QPS core的个数及选择
0 ~ 1w 2台 4cpu8g
1w ~ 10w >=2 8cpu32g 可以按照每台2w算,批量除外
10w ~5000w >=2 16cpu64g 可以按照每台4w算,批量除外

由于每个节点挂4T的存储,如果QPS较少,存储较多。可以选择多台4cpu16g的规格或者8cpu32g

存储介质选择

对于存储,我们目前有三个介质,第一个是SSD介质,第二是高效介质(使用SSD与SATA的混合),第三个介质是OSS,也就是直接基于我们的OSS服务。这个介质的特点就是:最热、一般热、温、冷的数据

冷热程度 介质类型 提供方式 业务类型
高性能 SSD云盘 HDFS方式,挂盘,包量 在线业务,延迟要求低,99.9 80ms以下
高效能 高效云盘 HDFS方式,挂盘,包量 在线业务,延迟要求一般,99.9 200ms以下
冷数据 OSS 接口方式提供,按需计费 准在线业务,主要存储冷数据,特殊的压缩算法、高压缩比例

后续的发展

  • 目前OSS还没有上线,预计2018年6-7月上线,上线后完全弹性计费
  • 针对SSD及高效的存储,目前还是采取磁盘的方式挂载,可以扩容及缩容;后续会提供完全弹性的SSD及高性能存储。 也就是本地没有HDFS。

社群

技术交流钉钉大群【强烈推荐!】 群内每周进行群直播技术分享及问答

相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
&nbsp; 相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情:&nbsp;https://cn.aliyun.com/product/hbase &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
安全 Shell 测试技术
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(3)
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(3)
182 0
|
分布式计算 Hadoop 分布式数据库
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(1)
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(1)
194 0
|
Shell 分布式数据库 API
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(2)
《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(2)
159 0
|
分布式计算 Hadoop 大数据
第3期:自建Hadoop集群 VS 阿里云EMR,差距居然这么大?
本期将为大家带来开源大数据平台E-MapReduce与自建Hadoop集群对比,一起来看看吧~
897 1
第3期:自建Hadoop集群 VS 阿里云EMR,差距居然这么大?
|
分布式计算 大数据 Hadoop
大数据组件-Hbase高可用架构部署
大数据组件-Hbase高可用架构部署
大数据组件-Hbase高可用架构部署
|
存储 监控 安全
HBase集群多租户实践
HBase集群多租户实践
463 0
HBase集群多租户实践
|
分布式计算 Hadoop 大数据
自建Hadoop集群 VS 阿里云EMR,差距居然这么大?
本期将为大家带来开源大数据平台E-MapReduce与自建Hadoop集群对比,一起来看看吧~
1058 0
自建Hadoop集群 VS 阿里云EMR,差距居然这么大?
|
安全 大数据 分布式数据库
云HBase备份恢复,为云HBase数据安全保驾护航
介绍了阿里云HBase自研备份恢复功能的基本背景以及基本原理架构和基本使用方法。
22728 0
|
存储 Java 分布式数据库
HBase实战 | 58HBase平台实践和应用-平台建设篇
HBase是一个基于Hadoop的分布式、面向列的Key-Value存储系统,可以对需要实时读写、随机访问大规模数据集的场景提供高可靠、高性能的服务,在大数据相关领域应用广泛。HBase可以对数据进行透明的切分,使得存储和计算本身具有良好的水平扩展性。
3708 0
|
存储 固态存储 分布式数据库
云HBase集群的规划
概述 在服务客户的时候,经常会被问到,我该选择什么配置的HBase呢?今天我们就来好好谈谈这个问题,希望能说清楚 基本架构 目前云HBase的基本架构为: 从架构图中,可以看出Master是主备的,且不存任何业务数据的;core节点至少2台,第一个节点为了节约节点,部署了一个zk,Core节点可以一直添加到100或者500个节点左右。
1131 0