引言
灾备存储设备用来对用户机房重要数据周期备份,对关键业务进行持续容灾。通常灾备存储有一个本地的管控界面,对灾备存储硬件设施和系统状态进行监控。但是必须在用户机房网络环境使用,而且各个设备需要登录不同的运维系统。近期《混合云备份》推出的“灾备存储-云维”服务。用户可以使用云维服务,随时随地在阿里云控制台统一管控用户所有的灾备存储设备,灵活定制设备指标报警规则,带来了灾备存储云端运维的新体验。
系统构架
目前云维平台适用于灾备存储A系、C系以及S系,支持的硬件型号为DR208和DR408。
以典型用户为例:用户在上海/杭州各有一个IDC,每个IDC根据业务情况,采购了一批A/C/S系列灾备存储设备。灾备存储设备除了短期备份到本地IDC,还会定期将指定数据备份到阿里云异地备份库,实现长期版本回溯和异地容灾。
老旧的灾备存储管控场景是运维人员必须连接到各自的IDC网络环境,直接访问灾备存储设备上的WEB页面或软件终端,逐个登录每台机器分别运维。而阿里云混合云存储服务推出的“云维”平台,彻底解决了多个地域多台设备之间低效繁琐的管控问题。通过构架图可以看到,云维平台相当于公网环境下一个集中管控的HUB,可以实现:
1,监控灾备存储设备硬件状态
2,监控灾备存储设备系统性能
3,设置各个监控项的报警(邮件/短信/电话)
4,云上直接进行备份/恢复操作(目前仅支持A系)
云维控制台
面板监控
面板监控可以实时获取灾备存储设备前后面板硬件信息,包括:硬盘插槽,硬盘,网卡,电源,风扇等等。有4个状态:
1,绿色,硬件状态正常
2,橙色,硬件可以使用,但是有警告
3,红色,检测到硬件,但是无法使用
4,灰色,没有检测到硬件
监控面板从设计上,将设备图标的位置根据不同硬件型号实物的相对位置排列,便于用户定位到问题设备。
系统监控
系统监控可以查看灾备存储系统资源使用情况,包括:存储使用量,CPU负载,CPU温度,内存使用量,网络吞吐量,网络质量。这些指标基本反映了灾备存储软件环境的健康状态。用户可以从不同时间纬度,查看毛刺或者大范围趋势。
存储
按照逻辑磁盘显示总容量和已经使用的容量。未来计划推出AI预测使用量趋势,并结合监控报警实现预警。帮助运维人员预测存储使用量,提前采购并合理分配本地存储。
CPU和内存
实时显示CPU和内存使用率,CPU可以按照物理核数分别查看,支持芯片温度显示。帮助运维人员评估灾备软件系统运行状况,合理切分备份任务。
网络
以网卡为维度,实时显示网络发送和接收的速率,并进行丢包检测。帮助运维人员评估带宽占用率,合理规划备份时间窗口。
监控报警
运维人员可以针对以上各个监控项目设置报警阈值,当某一个指标超过阈值时触发邮件/短信/电话报警,可以设置不同监控项通知不同的报警联系人。帮助运维人员全天24小时感知灾备存储系统运行状况,抢在问题发生之前提前做好预防方案。
传送门
以上就是混合云备份推出的“云维”平台典型使用场景和功能介绍。目前A系产品更是推出了大力度的软件免费1年促销,欢迎大家试用。
《混合云备份》详情页