OCP(OceanBase Cloud Platform)是企业级数据库管理平台
OceanBase 云平台(OceanBase Cloud Platform,OCP)是以 OceanBase 为核心的企业级数据库管理平台。不仅对 OceanBase 集群和租户等组件提供全生命周期的管理服务,同时也对 OceanBase 相关的资源(主机、网络和软件包等)提供管理服务,让DBA能够更加高效地管理 OceanBase 集群,降低企业的IT运维成本。
高效的OceanBase集群管理
支持高可用性
相应速度可达到秒级
可视化的体验
任务详情提供流程图和自然灵活的画布交互,管理任务进度更直观、高效。
新增集群和租户的拓扑图,透出分布式的业务逻辑,展示运行状态、关键数据
流畅高效的用户路径
对核心 Job 的任务进行串连设计,流程清晰、无断点
提供运维任务的快捷入口,在所有页面均可快速切换至任务
专业化的功能
提供 OceanBase 集群的全生命周期管理
针对 OceanBase 特性设计的管理功能
针对 OceanBase 特性设计的管理功能
精心设计的拓扑图功能
OCP产品架构和功能,一站式的管理运维工具
产品架构:
被管理者安装OCP Agent,OCP通过Agent管理和监控各个被管理者
OCP向管理员提供管理、监控、告警等功能
每个OCP节点具有完备的完整功能,单个节点可提供全部OCP的能力,当某 个OCP节点不可用时,自动调度到可用的OCP节点
OCP Server支持多节点部署,通过DNS、HAProxy、Nginx或者F5形式实现 负载均衡,确保系统高可用
依赖的软硬件资源:
OCP Server可以安装在物理机上,也可以安装运行在Docker容器中
X86架构下OCP Server支持RHEL、CentOS、AliOS、OpenSUSE等操作系 统;也支持ARM架构下的AliOS、中标麒麟、华为EulerOS等操作系统
OCP-Agent占用资源较少,对硬件资源没有特别要求
客户端使用Web浏览器访问OCP服务,支持Chrome、Firefox、Safari、 Edge等浏览器
OCP核心功能
1.集群管理:提供全生命周期管理,包括安 装、运维、性能监控、配置、 升级和删除等功能
2.主机管理:提供添加主机、删除主机、 主机关键信息显示等功能
3.租户管理:租户的创建、租户结构拓扑 图、性能监控、会话管理和 参数管理等
4.告警管理:支持集群、租户、主机等不同 维度的告警。系统基于告警规则生成告警
5.备份恢复管理:支持对OceanBase集群和租户级别进行全量备份、增量备份、 Redo-Log备份、完全恢复、不完全恢复等功能
6.用户及权限管理:通过对用户和角色的管理确保系统安全
集群管理-集群拓扑图
集群:展示集群的ID、集群类型 (主或备)以及集群当前的状态。 备集群图标上方还会展示当前的备库延迟时间。
Zone:展示了Zone名称、以及 Zone 当前的状态,包括 QPS、连接数和 Unit 数
Server:展示了 Server的IP地址以及Server当前的状态,包括 QPS、连接数和 SQL 端口
集群管理-租户管理
查看当前集群下工作负载最高 的 5 个租户的性能信息,包含 TPS、QPS、SQL 响应时间、 事务响应时间、活跃会话数、事件等待_次数、事件等待_时间、容量_表数量、容量_分区 数量等性能监控指标
根据业务需要,查看最近一小时、最近一天或最近一周的监控信息
集群管理-资源管理(1)
可以查看磁盘、分区副本、CPU和内存的趋势图
可以按Zone来查看资源情况
集群管理-资源管理(2)
查看每个 Zone 下的已分配内存、已分配 CPU、已使用磁盘 三个属性值,用来判断同 一类型资源在 Zone 内机器上的使用率是否 基本一致,如果基本一致则表明负载均衡。
根据已使用磁盘百分比来判断集群的磁盘容量是否够用,当磁盘使用到量到达磁盘容量 80%时,则可以考虑增加机器进行扩容,使磁盘水位保持正常水位。
租户管理-租户资源管理
在资源使用区域通过时间条件筛选,查看最近一周、一个月、六个月、一年或自定义时间段内的 磁盘、分区副本、CPU和内存信息
租户管理-租户性能管理
支持对性能与SQL、事务、 存储与缓存进行统计和监控。
可以按统计周期监控,也可以查看实时数据
可以按Zone及OBServer 查看数据
租户管理-SQL诊断
可以对可疑SQL、TopSQL和SlowSQL进行诊断,诊断识别风险语句,规避风险
告警管理-OceanBase告警级别
级别 |
英文定义 |
中文定义 |
颜色 |
说明 |
1 |
Down |
停服 |
紫 |
完全不可用,需要立即介入修复 |
2 |
Critical |
严重 |
红 |
系统可用性下降,需要紧急修复,避免完全不可用,如内存使用率大于 90%持续3分钟 |
3 |
Alert |
警告 |
橙 |
系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降, 如OB租户连接数大于上限的80% |
4 |
Caution |
注意 |
蓝 |
根据趋势判定,系统关键性能指标正在下降,但是还没达到触发警告的程 度,此次可通过排查发现潜在的问题,避免警告产生 |
5 |
Info |
提醒 |
绿 |
操作提醒,本质上不是告警,通常是管理员执行重要操作,如集群下线 |
告警管理-告警项
配置告警的范围、触发条件、检测周期、告警等级等信息
告警管理-查看告警事件
控制台的告警事件列表用于查看和检索全部告警。告警事件列表支持丰富的搜索条件,其中关键字搜索会匹配告警概述、告警详情和所有标签的值
告警管理-告警通道
告警本身是独立的功能,未配置通道和订阅时,只能通过控制台的告警事件页面查看告警。通过配置告警通道和告警订阅,用户可以接收告警通知消息。