基于KVM的H3C云计算平台CAS的一些运维经验

简介: 前言 在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

前言

在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

一、资源调整

(一)CPU

1.虚拟机在运行时,CPU的核数是不能进行调整的,只能调整CPU的个数。并且,个数只能增加不能减少。大部分虚拟机支持CPU个数热添加,有少部分虚拟增加CPU资源之后机需要重启。CentOS7.2-1511系统CPU资源在线添加之后立即生效。

2.CPU核心总数=CPU个数*每个CPU的核心数,CAS的CPU核心数是指每个CPU的核心数。

3.CAS平台的CPU是可以超额分配的。一般情况下,不需要绑定物理CPU。

(二)内存

1.在修改内存时我们会看到:“若虚拟机处于运行或者暂停状态,修改内存预留后,必须重启虚拟机才能生效,且修改后的内存值必须大于原内存大小”。实际在操作过程中是这样的,对于在线的虚拟机,增加虚拟机内存后是实时生效的,不能在线减少内存。如需减少内存资源配置,那就需要关闭虚拟机修改数值之后,再次启动。

2.虚拟机一般情况下内存不设预留值。

3.CAS的内存不能超配。如果CAS系统开启了系统预留内存,那么就必须保证至少剩余宿主机总内存的10%左右的预留值。主机内存预留值不足的情况下虚拟机是无法正常启动的,遇到紧急情况,可以暂时关闭CAS系统的主机内存预留,一小段时间后,启动虚拟机之后再开启主机内存预留。

(三)磁盘

1.关于磁盘的修改,系统提示:若虚拟机处于运行或者暂停状态,修改缓存方式、存储大小(对于支持Virtio磁盘在线扩容的虚拟机操作系统,Virtio磁盘在线扩容后无需重启虚拟机)、限制I/O速率(读/写)、限制IOPS(读/写)后,必须重启虚拟机才能生效 。由于新建虚拟机时一般都采用高速智能硬盘,因此是可以在线增加磁盘容量,无需重启系统的。

2.磁盘容量只能增加,不能减少,每次操作的时候需要谨慎考虑,不要过分浪费资源。

3.对于一些P2V、V2V迁移过来的虚拟机,有些硬盘接口需要特别考虑。

4.在CAS平台增加磁盘资源后,需要回到虚拟机操作系统对新分配的磁盘资源进行分区、挂载、LVM操作。目前一般使用LVM对磁盘进行管理,如遇特殊情况还需特别处理。

(四)网络

1.虚拟机创建时就要注意选择正确的虚拟交换机、网络策略模板。

2.一些特殊的网卡设备,还需对应型号进行设置。

3.如果是克隆过来的虚拟机,那么需要特别注意MAC地址。MAC地址出现冲突时,关闭虚拟机,更新MAC地址后再次启动虚拟机操作系统,系统启动后检查其他网络配置。其他网络配置无误,网络依然不通,则需要找出多余的网卡网络配置,删除或者更新配置文件内容,偶尔还需要手动更新MAC地址。此部分可以使用NetworkManager来进行操作。

4.虽然NetworkManager已经厂商设置开机启动,但是该工具并不能正常开机启动,使用NetworkManager时,必须先启动再使用。这一部分最常用的的命令为:mntui,网络配置、主机名修改等都非常有用。

二、运维要点

1、如果CVM进行过更改,那么更改完成之后第一件最重要的事是要检查CVM上的NTP服务,查看配置文件,时钟源配置是否正确,同步是否正常。CVM的DNS也是必须配置的项目,配置完成以后务必检查是否生效。CVM的状态、NTP服务、CVM的DNS解析是日常重点监控的对象,需要格外注意!

2.把CAS的CVM设置成主NTP。

3.虚拟机创建完成后,第一件事是卸载虚拟机自带的NTP软件,CentOS7.2无需操作,CentOS7.4自带了chrony的NTP服务软件,需要卸载,卸载完成安装CAStools后开启时间同步。由于CentOS7.3是奇数版本,日常较少使用,此处需要综合CentOS7.2和CentOS7.4进行考虑。Windows系统同样,关闭NTP同步,安装CAStools,开启时间同步。

4.对于新安装的CVK主机,安装完之后第一件事是对系统进行升级,必须保持版本与CVM一致,升级完毕之后才能将CVK主机增加到CAS平台被CVM管理。

5.为了降低物理主机宕机、重启造成的影响,需要在虚拟机上设置“主机启动后,自动启动虚拟机”,具体操作步骤为:修改虚拟机->更多->引导设备-自动启动-是。

6.CVK、CVM的安装过程中,需要主要的是,磁盘分区选择整块硬盘LVM管理,以便后期扩展磁盘空间。

7.CAS平台的虚拟机迁移不支持无中断业务迁移模式,在线迁移会造成虚拟机状态暂停,迁移完成之后部分服务可能需要重启。迁移都会造成业务中断,需要特别注意。但是可以采取克隆、切换业务的方式来减低业务中断带来的风险,需要具体情况具体分析。

8.CentOS7.4自带了firewalld防火墙,并且厂商预置状态为开机自动启动,很多时候端口不通的原因就来源于此,日常运维中注意即可。

9.Windows Server 2008 R2标准版增加内存需要关闭主机。常规的在虚拟机操作系统内关机的方式并未结束CVK上的相关虚拟机的进程,需要使用系统的关机菜单进行关机之后,修改内存重启,这样,新增的内存才能被系统正常使用。具体流程为:关闭(CAS主控制面板)->修改内存->启动虚拟机,企业版则不需要如此操作,增加后直接生效。

10.CVM配置文件的备份。这是一个很重要的操作,原则上每周至少备份一次,并且需要注意保持异机备份。每次版本升级之前必须进行备份,并且将备份文件保存到CAS系统以外的存储上。养成每次版本升级后系统确认无误后第一时间备份配置文件的习惯。

11.在虚拟机迁移之前需要在目标主机配置好虚拟交换机网络配置。如果使用网卡聚合功能,则需要提前在对应的网卡上进行相关的网络配置操作。

三、总结

1.本文是在本人运维H3C的CAS平台半年以后总结出来的经验,本着对自己或读者负责的态度,在写作本文时又进行了再次验证,但疏漏之处无法避免,希望诸位发现问题后第一时间告知本人,本人会在第一时间内完成验证并更正。

2.由于截图太浪费时间,本文无截图,敬请谅解。因为我是这样觉得的:能点进此文来的朋友应该都比较熟悉CAS云计算平台,很多地方只需点到为止即可,希望也给读者朋友带来思考质疑的空间,这样利于大家一起进步。

3.由于时间仓促,暂且写到此处,以后发现新内容再次更新。能力有限,疏漏之处,万望指出,感谢!

相关文章
|
2月前
|
运维 监控 安全
云计算时代的运维新策略
【8月更文挑战第20天】随着云计算的普及,传统的运维模式已不再适应现代企业的需求。本文将探讨云计算时代下,如何转变运维思路,采用新的运维策略以提高效率和降低成本。
49 3
|
4月前
|
监控 Cloud Native 持续交付
构建未来:云原生技术驱动的云计算平台
【5月更文挑战第52天】 随着数字化转型的不断深化,企业对于敏捷性、可扩展性和成本效益的需求日益增长。本文探讨了如何通过采纳云原生技术来构建和优化云计算平台,以支持不断变化的业务需求。文章首先概述了云原生技术的核心概念及其优势,随后详细分析了在设计云平台时应考虑的关键要素,并通过案例研究展示了云原生实践在实际中的应用效果。最后,文章提出了面向未来的云平台发展趋势和挑战。
|
2月前
|
存储 运维 监控
云计算时代的运维策略与挑战
【8月更文挑战第23天】在数字化浪潮的推动下,云计算已成为企业IT架构的核心。随着云服务的普及,运维(Operations)工作也迎来了新的变革。本文将探讨云计算环境下运维的新策略和面临的挑战,旨在为读者提供一份运维转型的指南。
|
3月前
|
存储 安全 数据库
阿里巴巴的云计算平台有哪些服务?
【7月更文挑战第1天】阿里巴巴的云计算平台有哪些服务?
332 57
|
2月前
|
运维 安全 Devops
云计算时代下的企业运维变革
【8月更文挑战第10天】随着云计算技术的飞速发展,企业运维管理正经历着前所未有的变革。本文将深入探讨云计算如何重塑企业运维的方方面面,从基础设施的虚拟化到自动化工具的应用,再到DevOps文化的兴起,以及这一切如何影响企业的业务流程和市场竞争力。我们将一同见证,在这个数字化加速的时代,企业如何在云的浪潮中乘风破浪,实现运维的高效、灵活与创新。
45 10
|
2月前
|
运维 Kubernetes 监控
|
2月前
|
运维 Kubernetes 关系型数据库
云计算运维工程师面试技巧
【8月更文挑战第6天】
208 1
|
2月前
|
存储 Linux 云计算
OpenStack云计算平台搭建
OpenStack 是一个开源的云平台管理项目,通过多个核心组件实现公有云、私有云和混合云的构建与管理。自2010年由NASA和Rackspace联合发起以来,已有众多企业和个人参与开发。OpenStack 简化了云部署流程,支持计算、存储和网络资源的高效管理,并兼容多种虚拟化技术和容器。最新版本为Xena,广泛应用于各行各业,如思科、英特尔等公司。
114 0
|
2月前
|
运维 安全 网络安全
云端安全之盾:云计算与网络安全的协同演进运维自动化之路:从传统到现代化的转变
【8月更文挑战第23天】在数字化浪潮下,云计算以其灵活性和可扩展性成为企业数字化转型的重要推手。然而,随着云服务的快速发展,网络安全威胁也日益增多。本文将探讨云计算与网络安全如何相互促进,共同成长,以确保信息安全,并分析云服务提供商采取的安全策略以及企业在采用云服务时应注意的安全实践。
|
2月前
|
运维 监控 网络安全
云计算时代的运维新思维:从反应式到主动式的转变
【8月更文挑战第22天】在云计算的浪潮中,传统运维模式已无法满足现代企业的需求。本文将探讨如何从被动应对问题的反应式运维,转变为主动预防问题的主动式运维,以提升运维效率和服务质量。
82 0
下一篇
无影云桌面