一键就绪的VMware Cloud Foundation

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 今天想和各位分享一下我前几天接触VMware Cloud Foundation(后文称VCF)的一些收获与感悟;在这里,我要感谢另一位来自VMware的大咖刘菲,在我学习VCF过程中,给予我非常大的帮助与支持。

我们先来探讨一个问题吧:就绪一个私有云环境,需要多久的时间?这个问题,其实非常的宽泛,我们不妨就以VMware的产品来举例。

  • 虚拟化几乎是所有企业IT的选择,而vSphere在X86市场的占比决定了私有云环境缺少不了服务器虚拟化的一席之地;
  • 传统集中式存储的弊端已经成为阻碍业务快速上线的瓶颈,超融合技术越来越被用户所接受,VMware VSAN作为近年来Gartner魔力象限的领导者,是市场占有率第一的超融合解决方案;
  • 随着国家出台网络安全相关的法律法规,NSX DataCenter因为可以提供东西向的细颗粒度防护,在护网行动之后,NSX相关的项目也在逐步增加。

为了更好地进行对比,我们就以就绪vSphere(ESXi和vCenter)、NSX DataCenter和vSAN作为私有云的基础架构进行分析与对比。无论是采用VCF还是普通项目实施的方式来落实一整套VMware SDDC的基础架构,都需要经历几个阶段:概念设计逻辑设计物理设计

image.png

    其中,真正能以详细配置说明书形式提供工程师项目实施的,当属“物理设计”,这其中包括了诸如ESXi服务器的网络地址、群集配置、功能开启等细枝末节的设定。拿一个4节点基础架构服务器来举例,“物理设计”中一定包括了如下部分:

    1. ESXi服务器的安装与网络基本配置;

    2. vCenter服务器的安装与部署,以及数据中心、群集、功能、虚拟交换机的配置;

    3. VSAN群集的配置,包括磁盘组、虚拟机存储策略等;

    4. NSX DataCenter管理、控制平面的安装与部署.....

    所有这些工作,需要工程师对VMware产品的安装、部署与配置比较了解,也至少需要2个工作日的时间(这是没有任何排障出现的情况),才能让私有云的基础架构基本就绪。

    那如果采用VCF呢?可能这一切就只需要鼠标的几次点击罢了,在2-3个小时内,就能完成上述4节点私有云环境基础架构的就绪,这一切是不是来得太快了?

下面就用一个实际的嵌套环境LAB向各位演示什么叫VCF的一键就绪:

image.png

这其中涉及三种不同的方面:

    第一,物理网络提前就绪,包括管理网络、vSAN网络、迁移网络以及承载VMware NSX逻辑网络的Underlay网络。

    第二,ESXi服务器提前就绪,包括操作系统的安装、初始化和其它一些预配置。

    第三,除Cloud Builder以外的其他组件,包括vCenter、NSX Manager等均自动部署并完成集成操作。

    我们来看看具体是如何实现的。

ESXi服务器就绪准备:

完成ESXi服务器操作系统的安装;

image.png

完成ESXi服务器操作系统初始化配置,包括网络地址、域名解析等;

image.png

确保ESXi服务器的网络可达、DNS解析正确;

image.png

访问ESXi WEB控制台;

image.png

设置正确的NTP服务器,并设置为开机自动启动,随后手动开启NTP同步;

image.png

设置SSH服务开机自动启动,随后手动开启SSH服务;

image.png

为ESXi服务器添加域名;

image.png

在管理-安装和用户-身份验证页面,将ESXi主机加入域,成为成员服务器;

image.png

确认域成员身份;

image.png

同时验证DNS解析是否正确。

image.png

Cloud Builder服务器(虚拟机)完成部署:

以OVF方式部署Cloud Builder虚拟机;

image.png

该虚拟机角色将完成包括vCenter、NSX Manager、NSX Controllers等其它服务器的安装与部署。

为虚拟机定义显示名称等常规参数;

image.png

对于自建不采用VxRail的场景,选择vcf部署模式,反之选择vcf-vxrail;定义包括默认管理员admin在内的密码和网络配置

image.png

确认各项参数无误,开始OVF模板的部署。

image.png

将“物理设计”转换成“Cloud Builder模板”:

      VCF的精髓之一在于Cloud Builder将根据模板的定义,自动完成一系列组件的安装、部署与配置,下面我罗列几个点,如:

  • 外置两台Platform Service Controller的部署(当前版本依旧采用vSphere6.7u3,尚未采用vSphere7.0,因此依旧保留增强型链接模式部署模型);
  • 一台vCenter服务器,以增强型链接模式加入到SSO域,并完成数据中心、群集、主机添加等一系列系统配置;
  • 一台NSX for vSphere Manager服务器,与vCenter实现集成,并完成主机准备、VXLAN就绪、三台NSX Controllers虚拟机、传输区域等一系列系统配置;
  • 一台SDDC Manager服务器,集中管理所有的这些“管理工作域”组件,包括ESXi、vCenter、NSX等;
  • 三台vRealize Log Insight服务器,并自动组成群集,提供对vCenter、ESXi、NSX等组件日志的集中收集和智能处理,提供管理员可交互式稽查。

管理员需要将普通的物理设计,转换成Cloud Builder能够识别的方式(模板);那如何来实现呢?等待Cloud Builder被正确以OVF方式部署,并开机正常运行;

image.png

image.png

访问VCF Cloud Builder界面,默认的用户名为admin;

image.png

严格按照checklist,检查VCF的物理环境等是否已经就绪;

image.png

下载EXCEL版本的配置文件模板。

image.png

下面将开始模板的填写工作,模板由6个Sheet组成,最后一个Sheet用于vSAN延展群集使用;因此管理员需要仔细填写前5个Sheet。

不同颜色背景代表不同的含义:

黄色格表示可以修改,

如果修改合规显示绿色,如果修改不合规会显示红色;

灰色和蓝色部分不可以自行修改。

image.png

比如将物理设计定义的服务器网络地址、主机名等以合规模板的格式进行填写,这个时间根据规模的不同,耗时会有所增减;在我的LAB环境中,这个阶段大约10分钟。

image.png

image.png

Cloud Builder根据模板定义完成各组件的自动化部署,实现一键式就绪:

回到Cloud Builder Web界面,上传并验证该配置文件;

image.png

等待所有验证的清单全部通过;

image.png

对于可能出现的Fail失败错误情况,根据提示修改EXCEL配置,如忘记添加了ESXi服务器许可;


image.png

修正错误后,继续验证;

image.png

如果没有错误或者手动确认忽略告警,执行下一步的自动安装部署操作;

image.png

执行Bring-up自动部署第一个管理工作域的步骤;

image.png


系统将根据EXCEL的配置,自动完成一台VCSA、两台PSC、一台NSXMGR、三台NSXCTRL、三台vRLI并组建群集、一台SDDCMGR的安装及集成工作,实现开箱即用的就绪私有云平台;

image.png

在后端可以看到,ESXi主机上开始部署相关的组件;

image.png

在vCenter显示完成部署后,访问vCenter,在外部PSC正确验证身份的情况下,可以看到整个管理工作域的架构和依次部署的其他组件;

image.png

image.png

由于Cloud Builder中,NSX纳管的主机节点,VTEP IP地址默认都是DHCP获取,在DHCP没有正确被配置的情况下(大部分场景均不采用DHCP方式分配VTEP IP地址),会出现错误;

image.png

访问vCenter控制台,进入NSX的网络与安全配置界面;重新配置VXLAN,创建一个IP地址池,并选择IP地址池分配的方式;

image.png

对于其他可能出现的错误,查看日志后,手动执行修复,并在Cloud Builder上执行retry操作;

image.png

等待VCF组件被正确部署,状态均为Success;

image.png

此时访问VCF的SDDC Manager,可以看到创建的管理工作域所有的运行状态;

image.png

在vCenter上也可以看到所有的组件均已经被正确创建并稳定运行。

image.png

     至此,一个就绪的私有云基础架构(包括计算、网络和存储)已经就绪,我们将这个环境,叫做“管理工作域”,全部的就绪时间在3.5小时,助力业务的快速上线。有人会问,VCF一定要采用VMware VSAN么?能不能用外置存储代替呢?关于这类问题,我也做几个总结:

    1. 只有通过Cloud Builder自动部署的,才能叫VCF,手动完成vSphere、VSAN和NSX的集成部署,不能算做VCF;
    2. VCF至少需要包括vSphere、VSAN和NSX,但是也支持外置数据存储;

    3. VCF至少需要4台服务器组成一个工作域,最多可纳管一个管理工作域和其它十四个工作域;工作域和群集并非一个概念,同一个工作域中可以有多个vSphere群集。

    可以看到,在VMware Cloud Foundation的世界中,工程师的价值体现在规划、设计、局部的实施(模板)和排障;其中更为重要的是规划与设计,我相信这是未来的一种趋势~

至此,我们已经完成了第一个管理工作域的安装与部署,各位有兴趣的小伙伴,可以利用自己的LAB也来动手做一做(每台ESXi虚拟机分配32GB内存即可),未来我还将继续深入地学习VCF,届时在与各位分享经验与收获。


相关文章
|
监控 Kubernetes Cloud Native
VMware、Pivotal和Google Cloud协力推出全新基于Kubernetes的容器服务——Pivotal Container Service(PKS)
本文讲的是VMware、Pivotal和Google Cloud协力推出全新基于Kubernetes的容器服务——Pivotal Container Service(PKS)【编者的话】定制化应用不再是难题——虚拟巨头协力Pivotal与谷歌,将自家产品线与Kubernetes容器编排系统进行全面对接。
2289 0
|
28天前
|
Ubuntu 网络安全 虚拟化
VMware虚拟机ping不通原因排查及分析
下面以 VMware 虚拟机为例进行介绍。
387 3
|
1月前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
105 50
|
2月前
|
安全 虚拟化 数据中心
Xshell 连接 VMware虚拟机操作 截图和使用
Xshell 连接 VMware虚拟机操作 截图和使用
64 4
|
2月前
|
Linux 虚拟化
vmware虚拟机安装2024(超详细)
vmware虚拟机安装2024(超详细)
357 6
|
6月前
|
Unix Linux 虚拟化
虚拟机VMware知识积累
虚拟机VMware知识积累
|
2月前
|
虚拟化 网络虚拟化 网络架构
虚拟机 VMware Workstation 16 PRO 的网络配置
虚拟机 VMware Workstation 16 PRO 的网络配置
90 2
|
3月前
|
存储 SQL 数据挖掘
虚拟化数据恢复—VMware虚拟机vmdk文件被误删除的数据恢复案例
虚拟化数据恢复环境: 某品牌服务器(部署VMware EXSI虚拟机)+同品牌存储(存放虚拟机文件)。 虚拟化故障: 意外断电导致服务器上某台虚拟机无法正常启动。查看虚拟机配置文件发现这台故障虚拟机除了磁盘文件以外其他配置文件全部丢失,xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。管理员联系VMware工程师寻求帮助。VMware工程师尝试新建一个虚拟机来解决故障,但发现ESXi存储空间不足。于是将故障虚拟机下的xxx-flat.vmdk磁盘文件删除,然后重建一个虚拟机并且分配固定大小的虚拟磁盘。
|
4月前
|
测试技术 Linux 虚拟化
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS
详细的VMware虚拟机安装macOS Big Sur的保姆级教程,包括下载VMware和macOS镜像、图解安装步骤和遇到问题时的解决方案,旨在帮助读者顺利搭建macOS虚拟机环境。
170 3
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS