阿里云开发者社区-开发者社区官方技术圈-问答-第10页-阿里云

在将一个应用做组件化拆解的时候，我们会遇到一个问题，像MySQL、Redis 这种要如何拆。拆成一个普通的组件（compent）的话，有些资源少的场景，每个应用分配一个独享MySQL 实例会导致资源不够分；拆成一个运维特征（trait）的话，每次申请一个实例的逻辑太重，不太符合一个特征的轻量级行为。所以我们将这类组件定义为addon。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

SREWorks在“On-Container”阶段，最终交付的是什么？

已解决

詹姆斯邦德00 2022-10-19 691浏览量回答数 1

容器技术的出现，此时，容器镜像Image 作为应用交付的最终形态，解决了语言包对机器运行环境的强依赖，进一步提升了应用运维的效率。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

SREWorks在“On-CloudNative”阶段，最终交付的是什么？

已解决

詹姆斯邦德00 2022-10-19 820浏览量回答数 1

是以“On-Container”为基础的，是前者在云原生时代的高级形态。“On-CloudNative”阶段最终交付物不仅包含最基本的容器镜像Image，还包含了一系列的运维特性，以支持容器编排等云原生场景需求。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在应用运维领域中，CI/CD 的三个核心阶段是什么？

已解决

詹姆斯邦德00 2022-10-19 918浏览量回答数 1

在应用运维领域中，CI/CD 已逐步演化成持续集成（Continous Integration）、持续交付（Continous Delivery）和持续部署（Continous Deployment）三个核心阶段。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在SREWorks持续交付云原生化的架构演进中，Docker in Docker的优点有什么？

已解决

詹姆斯邦德00 2022-10-19 1396浏览量回答数 1

• 弹性构建：所有构建Pod 所需资源由K8S 等云底座统一调度和回收。

• 安全可靠：构建Pod 满足所有资源及权限管控要求，更加安全可控。

• 无服务器：Pod 是容器化的，不再运行在ECS 等机器之上。

• 快速交付：在集群层面完成构建任务调度，更加及时且可扩展。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize和Helm在部署层面，有什么差异？

已解决

詹姆斯邦德00 2022-10-19 749浏览量回答数 1

虽然Kustomize 最为轻量，但因为Helm3 取消了Tiller 依赖，所以差别也不是很大，两者都是二进制命令工具生成YAML 后直接下发。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

SREWorks的OAM落地实践中，应用插件机制有哪些用途？

已解决

詹姆斯邦德00 2022-10-19 851浏览量回答数 1

各种组件（compent）和运维能力（trait）是从哪里来的呢？这些也是用插件机制增强出来的，可以看下图：

在Appmanager 中预先定好了各种能力的接口（interface），一个插件只要实现这些接口（interface）就能够将能力增强到Appmanager 中。用户可以基于这个机制来满足各种能力需求，比如将一个Flink 服务制作成一个组件（compent），用户只要寥寥几行在YAML 中加上这个组件，就能在自己应用中瞬间就有了流计算以及其管理能力。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize和Helm在工作流程上，有什么差异？

已解决

詹姆斯邦德00 2022-10-19 779浏览量回答数 1

Helm：定义Chart->填充->运行。在Chart 中没有定义的内容是无法更改的。

Kustomize：Base 和Overlay 都是可以独立运作的，增加新对象，或者对编写Base 时未预料到的内容进行变更，都非常简单。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

什么是CRD？

已解决

詹姆斯邦德00 2022-10-19 1034浏览量回答数 1

如果K8S 中的自带资源类型不足以满足业务需求，需要定制开发资源怎么办？自定义资源（Custom Resource）由此产生。那么，如何让Kubernetes 认识这些自定义的资源呢？CRD（Custom Resource Definition）就承担了一个说明书的角色，让Kubernetes 来认识这个自定义资源CR。

那么CRD 是怎么来的呢？最早是谷歌提出Third Party Resource 的概念，希望开发者以插件化形式扩展K8s API 对象模型，以增强整个k8s 的生态。基于Third Party Resource 这一概念，Kubernetes 社区在1.7 版本中提出了CRD 的概念。

随便打开一个CRD 的YAML 可以看到，其主体部分是使用OpenAPI v3 schema 来描述CR 的字段结构，类似编程语言中的强类型声明。

有了CRD 之后，我们可以自由地增加各种内置资源平级的资源，原本很多之前只维护在软件内部的元数据，也可以被写入到k8s 集群中。这极大地拓宽了我们的想象力，什么交换机、作业、路由等各种关联的资源都一股脑地放进集群里面去。

在各种自定义资源被放进去之后，就会有人问，这放进去是挺方便的，但是放进去就会生效吗？是的，资源的生效就是Operator 的功劳。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在应用部署上，大家或多或少有过一些这样的经历：面对复杂的K8S YAML 手足无措，有些字段能理解含义，有些字段光在字面上无法确认影响，有些字段提交修改就报错，提示这个字段不可被修改。如果说k8s 内置资源的字段基本都还有迹可循的话，通过CRD+Operator 创建的自定义资源的字段都会放飞自我，连文档都找不到。那么这些YAML 能不能做得像乐高积木一样呢？既能自由地插拔创造发挥，又有一些限制约束，使得创意不会太剑走偏锋，让使用者也能快速理解其中的作用和价值。

于是OAM 应运而生。OAM（Open Application Model）是一个标准的、基础设施无关的跨云应用部署模型。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

OAM（Open Application Model）有哪些特性？

已解决

詹姆斯邦德00 2022-10-19 811浏览量回答数 1

• 应用为先。一个应用的交付与部署应该是自包含的，其中的各类操作行为应该作为应用定义的一部分，这些内容与实际基础设施无关。

• 清晰和可扩展性。定义一套开放标准，可以模块化整个应用交付流程，根据个人需要将这些模块自由组装，达成自己想要的结果。

• 云服务供应商无关。定义的开放标准应该是一套更高级别的抽象，可以跨本地集群、跨云服务供应商，不会被锁定到任何一个厂商的底座。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

operator 的架构是如何实现的？

已解决

詹姆斯邦德00 2022-10-19 719浏览量回答数 1

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

SREWorks的OAM落地实践中，应用模块插拔有哪些用途？

已解决

詹姆斯邦德00 2022-10-19 768浏览量回答数 1

如上图的YAML 所示：

• 通过运维能力（trait）注入进行运维能力的增强，使部署者不用关注太多底座基础设施的细节。

• 通过各种组件（compent）的插拔和参数变量（parameterValues）的定制来满足应用的功能需求。

• 通过工作（workflow）和策略（policy）来定制部署策略，满足灰度发布、金丝雀发布等多样的发布策略。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

什么是Operator？

已解决

詹姆斯邦德00 2022-10-19 1214浏览量回答数 1

首先随便翻看一本词典看一下operator 这个词的定义：操作员/运算符，是个名词。

那么，operator 描述的应该是一个围绕“操作、控制”概念的东西。为了让大家有个更直观的认识，我们来举一个例子，比如1+2=3，这个“+”就是一个operator（运算符），这个“+”让两个数字发生了一些互动（相加）。

有了词典里的概念铺垫后，我们继续往下分析，既然是一种操作或运算，那么在k8s中，是谁来操作？而被操作的对象又是什么呢？让我们来看一下OperatorFramework 官网上对于Operator 的解释：

WHAT IS AN OPERATOR AFTER ALL?

An Operator represents human operational knowledge in software, to reliably manage an application. They are methods of packaging, deploying, and managing a Kubernetes application.

从这个定义中，我们可以看到，这个operator 是指由人发出的，对k8s 应用（Kubernetes application）展开的操作。一般围绕应用的操作有哪些？部署、升级、扩缩容、卸载等等。我们可以先这样理解，operator 应该就是一个类似控制器的东西，里面含有一些运维操作（后面会继续展开，其实不仅仅是这些）。

较真一点的读者可能会问，既然这样，这东西叫controller 是不是会更贴切一点呢？事实上，问出这个问题的读者，和真相很接近了，每个operator 基本都会有个控制器，但又不仅仅只有一个控制器，还会有前面提到过的资源定义：CRD（CustomResourceDefinition）。每种自定义资源背后都会有一个或多个控制器，让这些资源看起来像活的一样，我们举一个比较切近生活的例子：

我们为家里的灯制作一个CRD 和operator，把这个operator 和灯开关连起来，当用户修改这个YAML 的时候，operator 会向开关转发指令。

从名字可以看出这盏灯被放在卧室（bedroom），当power=on 的时候电灯打开，power=off 的时候电灯关闭，修改亮度（brightness）和色温（colorTemperature）能操纵这盏灯在打开状态下的视觉效果。

通过上面这段灯的YAML 我们可以发现，在CRD+operator 的场景下，我们可以只关注对象终态，而不去关注其中的控制过程。比如当前家中网络不太稳定，要花1-2 秒，重试3 次operator 才能成功下发指令打开灯，这些重试我们是不感知的。我们只知道只要将power 设置为on，灯就会亮。类比到k8s 的日常实践，也是这样：

一个Pod 被放到集群后，控制器会想方设法去克服困难：从仓库拉取镜像，启动工作负载，如果crash 掉了就立即重试，直到稳定运行为止。我们只关心这个Pod 是否最终拉起可用。

所以，operator 其实是一种架构理念，它区别于常见的shell 等运维脚本方案：

operator 希望应用能够自己管理自己，而不是由运维人员写脚本从外围来控制他们。

不过，如果仅仅是这样，可能operator 也只能叫controller 了，只是一些自控制的逻辑而已。从最前面提到的operator 的概念可以看出，operator 能够让两种以上的资源产生一些互动关系，那么这是如何实现的呢？

我们继续用上面的灯的例子再加个YAML 让大家感受一下：

我们把自己的家也用一个自定义资源对象来描述，用来承载一些家中的全局设置。

当我们家中所有人都出门的时候，家中就没有人了，于是将nobody 设为true。然后Home 的operator 会遍历家中所有的开关、电器、灯等设备，全部都给关上（在YAML 上设置power=off）。同时也会根据常亮的策略（stayOpen），保持某些电器不关闭，比如冰箱。

从上面的例子可以看出，每个控制器只负责自己的那部分，但从顶层往下看，已经实现了级联控制，能够实现牵一发而动全身的效果。这个就是上面所提到的operator 的更深一层的机制：能够像运算符一样，让几种资源产生某种互动关系，一起协作完成一些复杂的工程动作。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

如何实现K8S Operator？

已解决

詹姆斯邦德00 2022-10-19 1204浏览量回答数 1

不管是原生YAML/Helm 还是Kustomize，都是通过配置来搞定各类事情。然而CRD+Operator 就不一样了，它们让你直接接入apiserver，作为K8S 的一部分监听所有你关心的对象，并通过代码进行状态维持及管理。因为CRD 的开发是非常复杂的，除了业务逻辑之外，还需要做很多基础的工作，非常不便，所以有了Operator的开发框架（常见的有KubeBuilder 和Operator-SDK），让开发人员专注于CRD的业务代码开发。

我们可以来看一下operator 的架构实现，这个有助于我们理解operator 的工作原理：

如图可知，Operator 内部有个控制器来监听CR 的变化，同时由于每个变化对应的函数执行需要一定的耗时，所以引入一个队列来依次执行这些函数。由于整个逻辑的执行链路不同于普通的web服务，所以也需要一个框架来承载请求的流转。

市面上的KubeBuilder 或Operator-SDK 开发框架可以降低Operator 的难度，但Operator 的开发在当前所有的几类组件托管方案当中仍然是最为复杂的。前前后后需要CRD 设计及安装，编译Operator 及部署到集群，最后再下发CR，外围为了配套这些内容可能还需要上面Helm 或Kustomize 的协助，配合对应的CICD 流程及工具。

• Spark Operator

Spark Operator 是大数据分布式系统在k8s 场景一次经典的实践。原本Spark 的作业提交是需要通过spark-submit 命令，但有了Spark Operator 之后，我们可以直接向k8s 提交作业YAML，然后Spark Operator 监听CR，将这一作业提交给控制器。实现了我们前文提到的，将作业资源放在k8s 集群进行管理这一目标。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize和Helm的有哪些差异？

已解决

詹姆斯邦德00 2022-10-19 1453浏览量回答数 1

Kustomize 相对于Helm而言，更加的轻量，只有一个CLI 工具。也集成到了kubectl自身，使用及配置成本接近于0。Kustomize 放弃了对模板的要求，改为参考Docker镜像的形式，通过Base+Overlay 的方式对应用的原始YAML 进行派生。

• Base YAML 管控：Helm最大的特点是定制仅限于预先存在的配置选项。不仅如此，Chart 作者还必须用有点麻烦的模板化方式实现这些定制选项。这个时候Kustomize 不受限制的Overlay 会更加灵活，想怎么覆盖就怎么覆盖。所以Helm对Base YAML 强管控；而Kustomize 虽然也有Base，但Overlay 的存在让这个限制几乎不存在。

• 模板语法层面：Kustomize 相较于Helm去掉了模板语法，入门门槛更低，更易使用。当然如果玩的高阶，两者都要学习很多东西。

• 部署层面：虽然Kustomize 最为轻量，但因为Helm3 取消了Tiller 依赖，所以差别也不是很大，两者都是二进制命令工具生成YAML 后直接下发。

• 工作流程上：

 Helm：定义Chart->填充->运行。在Chart 中没有定义的内容是无法更改的。

 Kustomize：Base 和Overlay 都是可以独立运作的，增加新对象，或者对编写Base 时未预料到的内容进行变更，都非常简单。

基于上述工作流程的对比，如果是要公开发布一个复杂的组件，编写一个复杂而设计良好的Helm Chart 可以给用户很大帮助。用户在缺失了自由性之下，仅仅通过values.yaml 的阅读和配置就可以对这种复杂的部署产生一个较为深入的认知。

如果是常见的业务应用，虽然不同的部署之间差异不大（比如日常预发生产），但是因为快速迭代及需求变化，未必可以一开始就做好相关的变化限制，用Kustomize是更好的选择。

对于承载应用（Application）这个概念而言，Kustomize 和Helm 的短板是一致的，都没有进一步提供包之间的依赖处理、外部资源申请及维护、变量间传递等能力。

对于承载组件（Component）这个概念而言，Kustomize 和Helm类似，都是合适的工具。虽然Helm和Kustomize 在自身的能力和流程上有着很多区别，但最终流程都是：开发者（一堆YAML）->合适的参数映射及渲染方式->使用者（填参/覆盖）->apply 到目标K8S 中。萝卜青菜，各有所爱。"

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize和Helm在Base YAML 管控上，有什么差异？

已解决

詹姆斯邦德00 2022-10-19 769浏览量回答数 1

Helm最大的特点是定制仅限于预先存在的配置选项。不仅如此，Chart 作者还必须用有点麻烦的模板化方式实现这些定制选项。这个时候Kustomize 不受限制的Overlay 会更加灵活，想怎么覆盖就怎么覆盖。所以Helm对Base YAML 强管控；而Kustomize 虽然也有Base，但Overlay 的存在让这个限制几乎不存在。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize和Helm在模板语法层面，有什么差异？

已解决

詹姆斯邦德00 2022-10-19 724浏览量回答数 1

Kustomize 相较于Helm去掉了模板语法，入门门槛更低，更易使用。当然如果玩的高阶，两者都要学习很多东西。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，Chart 调试功能会带来什么好处？

已解决

詹姆斯邦德00 2022-10-19 715浏览量回答数 1

Helm 提供了一些命令让用户在安装前测试资源的正确性，检查Chart 是否正确生成，例如helm lint；helm install —dry-run — debug 等。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，应用安装状态感知会带来什么麻烦？

已解决

詹姆斯邦德00 2022-10-19 689浏览量回答数 1

对于Helm而言，将所有Chart 中的模版推到Kubernetes之后，它的install 过程就结束了，它并不关心yaml 中配置的各个组件在Kubernetes 中是否能有效运行，而这恰恰是用户最关心的部分，因此使用Helm安装可能会出现用户无法感知的异常。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，应用定制受限于预置变量会带来什么麻烦？

已解决

詹姆斯邦德00 2022-10-19 613浏览量回答数 1

Chart 是一种模板，Chart 的用户仅能通过对values的控制来定制组件的部署行为，模板中没有提供变量的位置，是无法在下游直接进行变更。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize有什么特点？

已解决

詹姆斯邦德00 2022-10-19 724浏览量回答数 1

Kustomize 的Overlay 可以在Base 的基础上，通过对resource/generator/transformer 等的定义，形成新的应用定义，不管是Base 还是Overlay，都可以通过kustomize build 生成有效的YAML。

• 功能简单清晰，kubectl 直接内部支持。

• 不考虑派生，仅仅作为组件的YAML 组织方式也很有帮助。

• 也有自己的插件系统，例如可以用简单的YAML 定义，使用文件生成ConfigMap/Secret 等。

• 允许注入K8S 运行时数据。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize是什么？

已解决

詹姆斯邦德00 2022-10-19 885浏览量回答数 1

Kustomize 是一套采用合并思想，对Kubernetes 原生配置进行管理的工具，使用无模板的方案定义应用配置。允许用户使用一系列的描述文件为基础，然后通过overlay 的方式生成最终部署应用所需的描述文件。

Kustomize 通过Base&Overlays 方式维护不同环境的应用配置，在Overlay 中描述差异来实现资源复用，管理的是Kubernetes 原生YAML 文件，不需要学习额外的DSL 语法。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，插件和工具生态会在部署中带来什么好处？

已解决

詹姆斯邦德00 2022-10-19 713浏览量回答数 1

作为CNCF 项目，Helm 已经变成了K8S 基础生态的一部分，各种各样的外部系统都会对它进行默认支持，CICD 工具集成方面有得天独厚的优势；同时用户能够从社区中获取丰富的专业知识和共享的Chart 包。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Kustomize是怎么做的？

已解决

詹姆斯邦德00 2022-10-19 738浏览量回答数 1

Kustomize 的文件结构如下：

app/base/kustomization.yaml 声明资源及要应用于它们的一些自定义，如添加一个通用的标签，其内容如下。kustomization 还提供了namePrefix 、commonAnnoations、images 等配置项。

可以通过kustomize build 命令来看完整的配置，build 出来的每个资源对象上都会存在通用的标签name:app。

app/overlays/staging/kustomization.yaml 中可以为演示环境定义不同的名称前辍、标签，通过patch 的方案将副本数设置为1。

app/overlays/production/kustomization.yaml 中可以为生产环境定义不同的名称前辍、标签，通过patch 的方案将副本数设置为2。

app/overlays/production-large/kustomization.yaml 中可以继承生产环境的定义，同时将副本数设置为10 支撑大规模场景需求。

通过不同的部署路径，指定不同的环境部署。

通过上面的例子我们可以看出，通过kustomization.yaml 来声明继承和patch，可以为各种场景构造不同的YAML 输出，同时保持底座YAML 不变化。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，确保Secret 安全性会在部署中带来什么好处？

已解决

詹姆斯邦德00 2022-10-19 664浏览量回答数 1

一些敏感数据在Kubernetes 中会存储为文本文件，作为Helm 模版和值的一部分，而helm-secrets 插件为关键信息提供秘密管理和保护，将相关值进行加密。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，YAML文件的无序部署会带来什么麻烦？

已解决

詹姆斯邦德00 2022-10-19 1013浏览量回答数 1

在YAML文件变多之后，尤其在Operator-CRD 场景下，YAML 下发常常需要存在一定的先后顺序。helm 中利用一个叫crd 目录来进行优先下发来避免问题。但实际工程实践中，对于顺序的要求会更复杂。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Helm中，方便的命令行会在部署中带来什么好处？

已解决

詹姆斯邦德00 2022-10-19 648浏览量回答数 1

对于简单变量，可以在部署的同时指定对应的参数，方便部署。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Helm有什么缺点？

已解决

詹姆斯邦德00 2022-10-19 1016浏览量回答数 1

• 应用定制受限于预置变量：Chart 是一种模板，Chart 的用户仅能通过对values的控制来定制组件的部署行为，模板中没有提供变量的位置，是无法在下游直接进行变更。

• YAML文件的无序部署：在YAML文件变多之后，尤其在Operator-CRD 场景下，YAML 下发常常需要存在一定的先后顺序。helm 中利用一个叫crd 目录来进行优先下发来避免问题。但实际工程实践中，对于顺序的要求会更复杂。

• 应用安装状态感知：对于Helm而言，将所有Chart 中的模版推到Kubernetes之后，它的install 过程就结束了，它并不关心yaml 中配置的各个组件在Kubernetes 中是否能有效运行，而这恰恰是用户最关心的部分，因此使用Helm安装可能会出现用户无法感知的异常。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

生命周期管理会Helm给带来什么好处？

已解决

詹姆斯邦德00 2022-10-19 683浏览量回答数 1

可以实现对组件实例的查询、安装、卸载、升级、回滚。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Helm有什么优点？

已解决

詹姆斯邦德00 2022-10-19 1204浏览量回答数 1

• 生命周期管理：可以实现对组件实例的查询、安装、卸载、升级、回滚。

• 方便的命令行：对于简单变量，可以在部署的同时指定对应的参数，方便部署。

• 插件和工具生态：作为CNCF 项目，Helm 已经变成了K8S 基础生态的一部分，各种各样的外部系统都会对它进行默认支持，CICD 工具集成方面有得天独厚的优势；同时用户能够从社区中获取丰富的专业知识和共享的Chart 包。

• 确保Secret 安全性：一些敏感数据在Kubernetes 中会存储为文本文件，作为Helm 模版和值的一部分，而helm-secrets 插件为关键信息提供秘密管理和保护，将相关值进行加密。

• Chart 调试功能：Helm 提供了一些命令让用户在安装前测试资源的正确性，检查Chart 是否正确生成，例如helm lint；helm install —dry-run — debug 等。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Helm是怎么做的？

已解决

詹姆斯邦德00 2022-10-19 695浏览量回答数 1

Helm 将上述对象都看作一个程序包内的部分，当我们想要对程序执行操作的时候，不需要告诉helm 我们要对哪个对象进行变更，只用传入程序名称，Helm 会帮助我们对程序下的每个对象执行相应的操作。

这个包含了一组yaml 文件的程序包，就叫做Helm Chart。Chart 是一个描述Kubernetes 相关资源的文件集合，它的格式如下：

开发时通常不会将name 硬编码在资源中，用户可以通过插入发布名称来生成name 字段。

所以我们的job.yaml 就变为了：

模板命令{ {.Release.Name}}将发布名称注入了模板。值作为一个命名空间对象传给了模板，用点(.)分隔每个命名空间的元素。

在执行helm install 命令时，模版渲染引擎会将括在{ {和}}之间的模版命令替换为values.yaml 中定义的值或用户通过--set 设置的值，并将渲染后的文件发送到templates/目录中，然后收集结果并发送给Kubernetes。

可以通过helm 命令对chart 执行相应的操作：

还能用Helm 创建自己的charts，也可以从Helm仓库中下载。

社区的Helm Chart仓库位于Artifact Hub，可以下载其他人上传的chart 到本地使用，也可以将自己制作的chart 上传到仓库中。同时Helm 也支持创建并运行私有仓库，供个人和组织内部使用。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Helm是什么？

已解决

詹姆斯邦德00 2022-10-19 584浏览量回答数 1

Helm 是Kubernetes 生态系统中的一个软件包管理工具，类似于类似于Ubuntu 中的apt、CentOS 中的yum 等。它可以被用于自动创建、打包、配置和部署应用程序和服务到Kubernetes 集群。

Kubernetes 为用户提供了自动部署、扩展和管理容器化应用程序的能力，然而用户部署在Kubernetes 集群上的应用可能会非常复杂，一个典型的应用（以SREWorks为例）通常会有一系列对象进行内部交互来使得程序正常运转。

首先我们需要Deployment 用于部署我们想要运行的pods，例如Mysql 数据库；StorageClass 用于动态分配存储卷；Persistent Volume（PV）用于储存数据库；Service 用于指定pod 的访问策略使得外部可以访问pod 的服务；Job 用于执行任务保证指定数量的pods 部署成功……

在Helm出现之前，每个对象都需要一个单独的yaml文件来配置，然后通过kubeclt apply 逐一创建这些对象。如果需要对其中的一些内容进行更改，必须找到对应的yaml 文件并在其中找到对应的属性；而如果想要升级其中的一些组件，也要仔细地编辑多个文件，防止错误和遗漏；当要删除这个应用程序时，也要手动删除其对应的所有组件……

Kubernetes 并不是从“应用程序”的层面来管理集群中的各个组件，它只是将用户提交上去的yaml 保存在集群中并各自运行，实际上它并不知道用户声明的各个对象，例如Job、Service、StorageClass、Deployment 等，是同一个应用程序下不同的组成成分。

当应用较为复杂的时候，要记住变量的位置并人工执行操作是一件冗余且复杂的事，并且会给多人协作开发应用增加难度。

在这样的基础上，Helm应运而生，为开发人员提供了模块化的应用管理工具，降低了Kubernetes 用户的工作量和工作复杂度。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Pending阶段，会进行哪些操作？

已解决

詹姆斯邦德00 2022-10-19 673浏览量回答数 1

Pod 资源创建完毕后，处于还未调度阶段，这个时候scheduler（调度器）基于podyaml 本身的配置与节点资源状态情况，来进行调度。

scheduler 会去分析PodYAML，将其中的策略提取出来，与节点组中的节点配置进行匹配，若匹配成功后，会选出最佳节点，重新修改pod yaml，将spec.nodeName更新掉，完成整个调度环节。

资源策略表明Pod 运行需要的资源情况，以demo 为例，Pod 需要2 核4G 的资源，那么调度过去的节点也需要有2 核4G 的资源剩余，Pod 才能运行在该节点上。

节点标签筛选策略，筛选节点是否存在topology.kubernetes.io/region:cnhangzhou。

亲和策略，有节点亲和与Pod 亲和（Pod 所在节点优先调度），常规来说可以优先满足亲和的节点上，当前例子就是节点亲和，满足标签disk-type=aaa 或者disktype=bbb。

污点策略，当节点上配置了污点，若Pod 没有容忍该污点的策略，则Pod 不允许调度到该节点上。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Object（元数据）中，Owner&GC（垃圾回收）是什么？

已解决

詹姆斯邦德00 2022-10-19 427浏览量回答数 1

基于Pod 的metadata.ownerReferences 找寻到对应的replicaset，replicaset 基于自身的metadata.ownerReferences 找寻到deploy；当deployment 被删除后，基于原有owner 构建的树状，回收原有的rs 与pod。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Terminating阶段，会进行哪些操作？

已解决

詹姆斯邦德00 2022-10-19 650浏览量回答数 1

client 在发起请求删除Pod 的时候，实际上是配置pod.metadata.deletionTimestamp，kubelet 感知到后，开始进行Pod 回收流程整个Pod 的回收周期，常规来说preStop—>SIGTERM—>SIGKILL

当kubelet 进行preStop 后，开始发起SIGTERM 给容器内进程，若超过总默认耗时30S（metadata.DeletionGracePeriodSeconds），则强制发起SIGKILL 给容器，也就是prestop+SIGTERM 总耗时不允许超过30s。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Object（元数据）中，label&labelSelector的作用是什么？

已解决

詹姆斯邦德00 2022-10-19 455浏览量回答数 1

Deployment 会根据自己的labelseletor：app=taihao-app-cluster 以及计算出podtemplate 的hash lable：pod-template-hash:5b8b879786，筛选出出符合的replicaset，replicaset 再根据自己的labelselector 去筛选出符合的pods，相应的服务发现service，也是通过labelselector 去筛选出符合的Pod。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Pending阶段，资源策略具体指什么？

已解决

詹姆斯邦德00 2022-10-19 516浏览量回答数 1

资源策略表明Pod 运行需要的资源情况，以demo 为例，Pod 需要2 核4G 的资源，那么调度过去的节点也需要有2 核4G 的资源剩余，Pod 才能运行在该节点上。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Spec 作为Pod 的期望状态，一定程度上也覆盖了Pod 完整生命周期的逻辑，Pod的生命周期分为

已解决

詹姆斯邦德00 2022-10-19 545浏览量回答数 1

• Pending：代表Pod 处于未调度阶段

• Creating：节点上的kubelet 已经发现了Pod，处于创建阶段

• Running：至少一个容器运行完毕，kubelet 这会发起健康监测

• Terminating：Pod 处于删除状态，kubelet 开始回收容器

• Terminated：Pod 销毁完成

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Pending阶段，亲和策略具体指什么？

已解决

詹姆斯邦德00 2022-10-19 471浏览量回答数 1

有节点亲和与Pod 亲和（Pod 所在节点优先调度），常规来说可以优先满足亲和的节点上，当前例子就是节点亲和，满足标签disk-type=aaa 或者disktype=bbb。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Running阶段，会进行哪些操作？

已解决

詹姆斯邦德00 2022-10-19 600浏览量回答数 1

在Pod running阶段的时候，Pod 就迎来对其健康的检查，当前kubelet 提供三种方式判定：

• readiness：检查Pod 是否为健康。

• liveness：件看Pod 是否正常，若检查失败，则重启容器。

• readinessGate：提供给第三方组件健康验证，第三方组件验证不过，则Pod 不为健康。

readiness 与liveness 检查参数都是一致的。

• httpGet/tcpSocket：都是检查方式，一种是http 请求验证，一种是tcpSocket，其中也有exec执行命令，以及grpc形式验证。

• initialDelaySeconds：延迟多久开始检查，原因在于容器启动的时候，通常需要过段时间进行验证。

• periodSeconds：检验时间周期。

• failureThreshold：连续几次失败，则代表这轮检验失败。

• successThreshold：连续几次成功，则代表这轮检验成功。

• timeoutSeconds：代表检验超时时间，若检验在该配置时间内没有返回，则认为检验失败。

readiness、liveness 虽然参数不一样，但对检验的结果行为不一致。

• readiness 默认状态下为false，也就是Pod 为不健康，直到检查通过，才将Pod变为健康。

• liveness 默认状态下为true，不会在刚开始就将Pod 重启，只有等检查不通过后，才会进行容器重启操作。

readinessGate 是Pod 健康的扩展， kubelet 会基于此，默认在pod.status.conditions 上配置对应的condition，比如当前例子readinessGate 为conditionType:TestPodReady，则相应就会有conditions。

当该condition.status 为false 时，则Pod 就会一直是不健康，哪怕readiness 检查通过，直到第三方系统去操作更新Pod 该condition.status 为true，才可以将Pod 变为健康，这样就可以接入更多的Pod 健康指标。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

在Pod running阶段的时候，Pod 就迎来对其健康的检查，当前kubelet 都提供哪些判定

已解决

詹姆斯邦德00 2022-10-19 480浏览量回答数 1

• readiness：检查Pod 是否为健康。

• liveness：件看Pod 是否正常，若检查失败，则重启容器。• readinessGate：提供给第三方组件健康验证，第三方组件验证不过，则Pod 不为健康。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

1

回答

Pod 生命周期在Creating阶段，会进行哪些操作？

已解决

詹姆斯邦德00 2022-10-19 574浏览量回答数 1

当Pod 调度完毕后，开始创建阶段，Kubelet 会基于pod.spec 期望状态来创建出Pod；Kubelet 在创建Pod 阶段，总共大致经历以下过程：

• Group 配置：主要是为了容器配置cgroup，里面涉及了对容器资源限制，比如不允许超过cpu、memory 配置，这里涉及到Pod 的qos 级别判定。

• 初始化环境配置：主要是对相关Pod 数据存储目录进行配置，涉及到volume，则会去引用CSI 协议，也会去获取镜像secret，为了后续拉取镜像进行准备工作。

• 创建pause 容器：创建pause 容器，该容器主要是为了后续配置容器网络，配置容器网络会去调用CNI。

• 创建Pod 容器：基于imagesecret 拉取业务镜像，在创建Pod 容器阶段，也会将相应的Pod YAML 配置传输进去，在启动Pod 容器完毕后，会基于poststart进行相关的回调。

以上内容摘自《SREWorks 云原生数智运维工程实践》电子书，点击https://developer.aliyun.com/ebook/download/7784可下载完整版。

胡嘞嘞赞 0 评论 0

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开发者社区官方技术圈

全部

问答

官方博客

视频

活动

技术作品

课程

SREWorks 的中心管控AppManager中的Provider 模块主要负责什么？

在SREWorks持续交付云原生化的架构演进中，Docker out of Docker的缺点有什么

目前支持在容器内部进行镜像构建的开源技术有什么？

SREWorks 的中心管控AppManager中的RunningState，FailureStat

云原生化的持续交付应包含哪些显著特点？

SREWorks在“On-Machine”阶段，最终交付的是什么？

SREWorks的OAM落地实践中，如何进行应用组件的构建？

SREWorks的OAM落地实践中，应用组件Addon 体系是什么？

SREWorks在“On-Container”阶段，最终交付的是什么？

SREWorks在“On-CloudNative”阶段，最终交付的是什么？

在应用运维领域中，CI/CD 的三个核心阶段是什么？

在SREWorks持续交付云原生化的架构演进中，Docker in Docker的优点有什么？

Kustomize和Helm在部署层面，有什么差异？

SREWorks的OAM落地实践中，应用插件机制有哪些用途？

Kustomize和Helm在工作流程上，有什么差异？

什么是CRD？

OAM是什么？

OAM（Open Application Model）有哪些特性？

operator 的架构是如何实现的？

SREWorks的OAM落地实践中，应用模块插拔有哪些用途？

什么是Operator？

如何实现K8S Operator？

Kustomize和Helm的有哪些差异？

Kustomize和Helm在Base YAML 管控上，有什么差异？

Kustomize和Helm在模板语法层面，有什么差异？

在Helm中，Chart 调试功能会带来什么好处？

在Helm中，应用安装状态感知会带来什么麻烦？

在Helm中，应用定制受限于预置变量会带来什么麻烦？

Kustomize有什么特点？

Kustomize是什么？

在Helm中，插件和工具生态会在部署中带来什么好处？

Kustomize是怎么做的？

在Helm中，确保Secret 安全性会在部署中带来什么好处？

在Helm中，YAML文件的无序部署会带来什么麻烦？

在Helm中，方便的命令行会在部署中带来什么好处？

Helm有什么缺点？

生命周期管理会Helm给带来什么好处？

Helm有什么优点？

Helm是怎么做的？

Helm是什么？

Pod 生命周期在Pending阶段，会进行哪些操作？

Object（元数据）中，Owner&GC（垃圾回收）是什么？

Pod 生命周期在Terminating阶段，会进行哪些操作？

Object（元数据）中，label&labelSelector的作用是什么？

Pod 生命周期在Pending阶段，资源策略具体指什么？

Spec 作为Pod 的期望状态，一定程度上也覆盖了Pod 完整生命周期的逻辑，Pod的生命周期分为

Pod 生命周期在Pending阶段，亲和策略具体指什么？

Pod 生命周期在Running阶段，会进行哪些操作？

在Pod running阶段的时候，Pod 就迎来对其健康的检查，当前kubelet 都提供哪些判定

Pod 生命周期在Creating阶段，会进行哪些操作？

公告

官网链接

友情链接