文档备案控制台

开发者社区数据库关系型数据库文章正文

云HBase建设之开篇

2017-03-13 4551

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里云云HBase团队在2月份推出了云HBase产品，此款产品的内核在集团内部已经使用了6年之久，那么跟社区版本的HBase有怎样的区别，我们又做了怎样的产品化，本系列将会为用户详细介绍这些点。

前言

阿里云云HBase团队在2月份推出了云HBase产品，此款产品的内核在集团内部已经使用了6年之久，那么跟社区版本的HBase有怎样的区别，我们又做了怎样的产品化，本系列将会为用户详细介绍这些点。
云HBase地址：https://cn.aliyun.com/product/hbase

云HBase

云HBase的内核是基于开源社区1.1版本系列，在此之上深度改造，之前阿里在较早版本有较多的优化也会渐渐迁移到此版本中。目前在内部服务了整个集团的大数据结构化存储需求，比如：平台类需求：日志同步服务、监控系统等；用户物体行为类需求：淘宝交易、收藏夹、旺旺消息、物联网等；报表类需求：天猫大屏、商家报表等。这些有很大一部分是因为Mysql等传统关系型数据库不能满足需求，分库分表又比较麻烦且不能根本解决问题。较大的一些互联网公司，比如：google、facebook、alibaba在较早就寻求了新的解决方案-HBase。随着互联网的发展，我们遇到很多中小型公司，都有数T、数P的HBase集群，且这些集群没有改动过一行HBase源代码，出现问题后也只能干瞪眼，服务长时间不可用甚至面临数据丢失的风险，更加不会去改造HBase以满足日益增长业务需求。
云HBase团队不会满足就拿开源包装，我们真正做的是需要深度改造内核，满足日益复杂化、多样化的大数据存储需求。阿里从2011年初开始步入HBase的发展、建设之路，是国内最早应用、研究、发展、回馈的团队，也诞生了HBase社区在国内的第一位Committer，成为HBase在中国发展的积极布道者。过去的几年时间，阿里累积向社区回馈了上百个Patch, 在诸多核心模块的功能、稳定性、性能作出积极重大的贡献，拥有多位Committer，成为推动HBase的长远发展的重要力量之一。

云HBase建设

主要是两个体系：

管控体系：由于我们有数千个、甚至数万个HBase集群，所以，我们必须是自动化的。这个体系建设的是怎么去管控好10000个HBase集群，为数万家公司提供云HBase的服务。
内核建设：目前云HBase主要围绕云上构建HBase，需要充分利用云的优势，比如：弹性、资源无限、随时随地、默认有多个可用区及多个地区。我们主要围绕：性能、运维、成本、安全、可用性、功能等方面建设内核。

具体会在每个章节具体论述，由于篇幅较多，本篇博客，只作为指引。
hbase_

场景特性类

HBase的特性比较多，比如：TTL、离散的TTL、多版本、动态列、异步写等等。这些根据具体的场景结合能发挥HBase较大的优势，也会有一些篇幅总结此类，当然也会穿插在云HBase的建设之中。

云HBase助力物联网建设

社区HBase

我们也会积极贡献回社区，我们也会积极跟进社区的新的功能，也会把社区好功能反馈到云HBase中。

后记

我们有很多功能没有放出来，或者说在公测阶段没有，或者还来不及产品化，请一定关注我们的产品发展。此篇博文系列，也将会列出后续云HBase重点的特性、功能点。云HBase团队目的就是让客户能享受阿里巴巴一样的HBase服务，每个公司都能基于云HBase做出自己好的产品。

社群

技术交流钉钉大群阿里云 HBase+Spark社区【强烈推荐！】群内每周进行群直播技术分享及问答

加入方式1：点击link申请加入 https://dwz.cn/Fvqv066s
加入方式2：钉钉扫码加入：

文章标签：

云数据库 HBase 版

Hbase

分布式数据库

物联网

大数据

封神

目录

相关文章

泡沫o0

|

安全 JavaScript 前端开发

QML信号与信号槽实践指南：轻松掌握现代软件开发的关键技术（三）

QML信号与信号槽实践指南：轻松掌握现代软件开发的关键技术

泡沫o0

635 0 0

BIT_666

|

存储 SQL 分布式计算

Flink - 读取 Parquet 文件 By Scala / Java

parquet 文件常见与 Flink、Spark、Hive、Streamin、MapReduce 等大数据场景，通过列式存储和元数据存储的方式实现了高效的数据存储与检索，下面介绍 Flink 场景下如何读取 Parquet。

BIT_666

2250 0 0

Flink - 读取 Parquet 文件 By Scala / Java

技术小大人

|

数据库数据安全/隐私保护 Windows

AD迁移工具：ADMT

技术小大人

2355 0 0

橘子味的外太空

EDA设计：原理、应用与代码实践

EDA设计：原理、应用与代码实践

橘子味的外太空

993 1 1

蓝易云

|

11月前

|

开发工具 git 开发者

Git流程控制：远程仓库操作的实用指南

通过遵循这些步骤和策略，你将能够更有效地与远程仓库进行交互，确保代码变更的透明度和项目历史的干净。同时，良好的版本控制习惯可以减少潜在的冲突，并帮助保持代码库的整洁。在日常工作中应用这些实用的Git流程控制技巧将是非常有益的。

蓝易云

311 0 0

西瓜味的敌敌畏

|

JavaScript Java 网络安全

应用层

西瓜味的敌敌畏

813 2 2

山东布谷科技_sun

|

Web App开发编解码算法

布谷一对一直播源码开发:阿里云视频语音通话社交交友App的必备功能

在当今移动社交领域，一对一视频和语音通话功能已成为用户期待的基础配置。从熟人社交到陌生人交友，从专业咨询到情感陪伴，实时音视频互动能力直接决定了社交App的用户留存和市场竞争力。山东布谷科技将深入探讨一对一直播源码开发高质量一对一视频和语音通话功能的关键要素和技术实现方案。

山东布谷科技_sun

464 3 3

布谷一对一直播源码开发:阿里云视频语音通话社交交友App的必备功能

大树营养快线

|

移动开发编解码 JavaScript

MediaSource 规范

【10月更文挑战第26天】MediaSource 规范是 HTML5 中用于处理媒体流的一项重要技术

大树营养快线

509 10 10

听风de歌

|

网络协议算法安全

TCP SYN洪水攻击 (TCP SYN Flood)

【8月更文挑战第17天】

听风de歌

1004 2 2

游客j4mujezz7vm7y

pydub 歌曲，提取副歌，音乐歌曲切片，渐进渐出，音量，歌曲歌谱

pydub 歌曲，提取副歌，音乐歌曲切片，渐进渐出，音量，歌曲歌谱

游客j4mujezz7vm7y

422 0 0

数据库

关系型数据库

热门文章

最新文章

什么场景应该用 MongoDB ？

PostgreSQL 如何实现批量更新、删除、插入

PostgreSQL upsert功能(insert on conflict do)的用法

Linux 性能诊断 perf使用指南

PostgreSQL 9种索引的原理和应用场景

PostgreSQL 如何潇洒的处理每天上百TB的数据增量

Jedis常见异常汇总

PostgreSQL 9.5+ 高效分区表实现 - pg_pathman

PostgreSQL 百亿数据秒级响应正则及模糊查询

时序数据库分析 - TimescaleDB时序数据库介绍

【赵渝强老师】使用Oracle可传输的表空间迁移数据

【赵渝强老师】OceanBase的租户回收站

云数据库自研存储引擎：阿里云 PolarDB 相比开源 MySQL 性能提升数倍

Oracle 迁移上云首选方案：阿里云 RDS 一站式迁移实践

关系型数据库，阿里云问鼎7连冠！

MySQL迁移到国产数据库实战指南：以金仓为例

数据库数据恢复-系统表损坏无文件残留SQL Server数据库数据恢复全过程

【赵渝强老师】MySQL Cluster

从开源插件到生产级引擎：PolarDB PostgreSQL的向量能力新范式

【数据库数据恢复】Oracle数据丢失问题处理与恢复技巧

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！