Service Mesh Interface 是 Kubernetes
上服务网格的标准接口。它定义了一组资源,可用于实现该资源的服务网格。您可以在规范中阅读有关它的更多信息。
目前,Linkerd
支持 SMI
的 TrafficSplit
规范, 该规范可用于在本地执行跨服务的流量拆分。这意味着您可以在没有任何额外组件/配置
的情况下应用 SMI
资源, 但这显然有一些缺点,因为 Linkerd
可能无法添加特定于它的额外特定配置, 因为 SMI
更像是服务网格功能的最小公分母
。
为了解决这些问题,Linkerd
可以使用一个适配器, 将 SMI
规范转换为它可以理解和执行操作的原生 Linkerd
配置。这也消除了与 SMI
资源与控制平面的额外原生耦合, 并且适配器可以独立移动并拥有自己的发布周期。Linkerd SMI 是一个可以做到这一点的扩展。
本指南将引导您安装 SMI
扩展并配置 TrafficSplit
规范,以跨服务执行流量拆分(Traffic Splitting)
。
前提条件
- 要使用本指南,您需要在集群上安装
Linkerd
。
安装 Linkerd-SMI 扩展
CLI
通过运行以下命令安装 SMI
扩展 CLI
二进制文件:
curl -sL https://linkerd.github.io/linkerd-smi/install | sh
或者,您可以直接通过发布页面下载 CLI
。
第一步是将 Linkerd-SMI
扩展安装到您的集群上。此扩展包含一个 SMI-Adaptor
,可将 SMI
资源转换为原生 Linkerd
资源。
要安装 Linkerd-SMI
扩展,请运行以下命令:
linkerd smi install | kubectl apply -f -
您可以通过运行以下命令来验证 Linkerd-SMI
扩展是否已正确安装:
linkerd smi check
Helm
要安装 linkerd-smi
Helm chart,请运行:
helm repo add l5d-smi https://linkerd.github.io/linkerd-smi helm install l5d-smi/linkerd-smi --generate-name
安装示例应用程序
首先,让我们安装示例应用程序。
# create a namespace for the sample application kubectl create namespace trafficsplit-sample # install the sample application linkerd inject https://raw.githubusercontent.com/linkerd/linkerd2/main/test/integration/trafficsplit/testdata/application.yaml | kubectl -n trafficsplit-sample apply -f -
这将安装一个简单的客户端
和两个服务器
部署。服务器部署之一,即 faling-svc
总是返回 500
错误, 而另一个,即 backend-svc
总是返回 200
。
kubectl get deployments -n trafficsplit-sample NAME READY UP-TO-DATE AVAILABLE AGE backend 1/1 1 1 2m29s failing 1/1 1 1 2m29s slow-cooker 1/1 1 1 2m29s
默认情况下,客户端将访问 backend-svc
服务。这在 edges
子命令中很明显。
linkerd viz edges deploy -n trafficsplit-sample SRC DST SRC_NS DST_NS SECURED prometheus backend linkerd-viz trafficsplit-sample √ prometheus failing linkerd-viz trafficsplit-sample √ prometheus slow-cooker linkerd-viz trafficsplit-sample √ slow-cooker backend trafficsplit-sample trafficsplit-sample √
配置流量拆分
现在,让我们应用一个 TrafficSplit
资源在 backend-svc
上执行流量拆分, 以在它和 failing-svc
之间分配负载。
cat <<EOF | kubectl apply -f - apiVersion: split.smi-spec.io/v1alpha2 kind: TrafficSplit metadata: name: backend-split namespace: trafficsplit-sample spec: service: backend-svc backends: - service: backend-svc weight: 500 - service: failing-svc weight: 500 EOF
因为 smi-adaptor
监视 TrafficSplit
资源, 它会自动创建相应的 ServiceProfile
资源来执行相同的操作。这可以通过检索 ServiceProfile
资源来验证。
kubectl describe serviceprofile -n trafficsplit-sample Name: backend-svc.trafficsplit-sample.svc.cluster.local Namespace: trafficsplit-sample Labels: <none> Annotations: <none> API Version: linkerd.io/v1alpha2 Kind: ServiceProfile Metadata: Creation Timestamp: 2021-08-02T12:42:52Z Generation: 1 Managed Fields: API Version: linkerd.io/v1alpha2 Fields Type: FieldsV1 fieldsV1: f:spec: .: f:dstOverrides: Manager: smi-adaptor Operation: Update Time: 2021-08-02T12:42:52Z Resource Version: 3542 UID: cbcdb74f-07e0-42f0-a7a8-9bbcf5e0e54e Spec: Dst Overrides: Authority: backend-svc.trafficsplit-sample.svc.cluster.local Weight: 500 Authority: failing-svc.trafficsplit-sample.svc.cluster.local Weight: 500 Events: <none>
正如我们所见,已经创建了一个带有 DstOverrides
的相关 ServiceProfile
来执行 TrafficSplit
。
可以通过运行 edges
命令来验证流量拆分。
linkerd viz edges deploy -n trafficsplit-sample SRC DST SRC_NS DST_NS SECURED prometheus backend linkerd-viz trafficsplit-sample √ prometheus failing linkerd-viz trafficsplit-sample √ prometheus slow-cooker linkerd-viz trafficsplit-sample √ slow-cooker backend trafficsplit-sample trafficsplit-sample √ slow-cooker failing trafficsplit-sample trafficsplit-sample √
这也可以通过在 TrafficSplit
资源上运行 stat
子命令来验证。
linkerd viz stat ts/backend-split -n traffic-sample NAME APEX LEAF WEIGHT SUCCESS RPS LATENCY_P50 LATENCY_P95 LATENCY_P99 backend-split backend-svc backend-svc 500 100.00% 0.5rps 1ms 1ms 1ms backend-split backend-svc failing-svc 500 0.00% 0.5rps 1ms 1ms 1ms
这也可以通过检查 smi-adaptor
日志来验证。
kubectl -n linkerd-smi logs deploy/smi-adaptor smi-adaptor time="2021-08-04T11:04:35Z" level=info msg="Using cluster domain: cluster.local" time="2021-08-04T11:04:35Z" level=info msg="Starting SMI Controller" time="2021-08-04T11:04:35Z" level=info msg="Waiting for informer caches to sync" time="2021-08-04T11:04:35Z" level=info msg="starting admin server on :9995" time="2021-08-04T11:04:35Z" level=info msg="Starting workers" time="2021-08-04T11:04:35Z" level=info msg="Started workers" time="2021-08-04T11:05:17Z" level=info msg="created serviceprofile/backend-svc.trafficsplit-sample.svc.cluster.local for trafficsplit/backend-split" time="2021-08-04T11:05:17Z" level=info msg="Successfully synced 'trafficsplit-sample/backend-split'"
清理
通过运行以下命令删除 trafficsplit-sample
资源
kubectl delete namespace/trafficsplit-sample
结论
不过,Linkerd
目前支持直接读取 TrafficSplit
资源,ServiceProfiles
总是优先于 TrafficSplit
资源。将在进一步的版本中删除对 TrafficSplit
资源的支持,在该版本中,需要 linkerd-smi
扩展以将 SMI
资源与 Linkerd
一起使用。