《CDP企业数据云平台从入门到实践》——CDP之数据储存(3) https://developer.aliyun.com/article/1226404?groupCode=ClouderaCDP
四、 部署 OPDB
1. OPDB 形态
OPDB 有三种形态:集群模式、DataHub 和 COD。
1) 集群模式:在具有 CDP 私有云基础的裸机上
• 存储在 HDFS 中的数据。
• 在裸机上运行的集群允许针对硬件最大程度地调整工作负载。
• 最可定制化的产品。
2) DataHub:CDP 公有云上的经典风格
• 云对象存储中的数据。
• CDP 公有云中的模板化部署。
• 提供一些可定制性,易于在公共云环境中进行配置。
3) COD:CDP 公共云上的托管服务
• 云对象存储中的数据。
• 支持自动缩放、自动调整和自动修复。
• 最容易配置,最低的管理开销。
目前在阿里云上的产品是经典形态,未来将上架 COD 形态。
2. OPDB 分布式架构
如图所示,OPDB 分布式架构由两部分组成:应用端/客户端(Apps/Clients)和 Server
端 OPDB。
1) 应用端/客户端:包括 JVM、Python、Javascript、SQL/JDBC 等。
2) Server 端:
• 接口:通过 REST Gateway、Thrift Gateway、Phonix Query Server 访问 OPDB。
• OPDB 主要是 HBase 集群,通过 Zookeeper 支持高可用,底层存储支持 HDFS、
S3、ADLS 等。
3. 未来:COD 的新功能
1) 针对开发人员和管理人员的利好
COD 的新功能可以减少开发人员和管理人员的工作,让他们能将时间花在更重要的事情上。
• 开发人员:轻松快速部署,部署操作更简单,只需 3 次点击,20 分钟即可完成部署。
• 管理人员:自主管理,支持自动伸缩、自动优化和自动修复,有效减少管理开销。
2) 连接到 COD
每个 COD 实例都有一个主页,其中包含各种类型的客户端的连接信息。连接方式包括:HBase、Phonix、JDBC 等。
3) COD 提高运营敏捷性
• 自动配置:减少配置开销
自动配置 Kerberos、TLS、缓存设置等。
默认情况下高度可用。
简化的复制设置。
• 自动缩放:调整峰值和平均负载
根据应用需求自动扩缩容。
降低基础设施成本。
• 自动优化:优化运行的工作负载
检测和缓解热点。
随着数据的增长,消除了对区域管理和平衡的需求。
4) 轻松的混合云部署
COD 作为未来混合云部署的重要组成部分,支持与本地 Data Centre 的 OPDB 以及其他公有云产品的 OPDB 进行交互,用于测试/开发、弹性、灾难恢复和云迁移。
COD 复制:
• 两次点击部署云集群。
• 基于向导的双向实时复制设置。
• 云数据库没有管理开销。
• 没有供应商差异,确保简化的应用程序提升和转移。