容器编排Kubernetes之kube-dns源码解读

简介: 花了几天时间,研究了Kubernetes DNS插件的源代码,对其实现有了个简单的理解。这篇文章我简单梳理下代码流程。 注:阅读DNS源码前,可以阅读DNS原理入门增加对DNS的认识。 架构图 这是我简单画的架构图,希望能帮助大家理解。

花了几天时间,研究了Kubernetes DNS插件的源代码,对其实现有了个简单 的理解。这篇文章我简单梳理下代码流程。

注:阅读DNS源码前,可以阅读DNS原理入门增加对DNS的认识。

架构图

20170523213042

这是我简单画的架构图,希望能帮助大家理解。

代码结构

k8s.io

| dns

| cmd // 三大组件的入口

| dnsmasq-nanny // DNS缓存

| kube-dns // dns主项目

| sidecar // 附加组件

| pkg 组件代码库,主要实现代码在该目录下

| dns // kube-dns代码库, 监听service、pod等资源,动态更新DNS记录

| dnsmasq // 内部封装dnsmasq程序用于缓存,并可从dns服务器获取dns监控指标

| sidecar 用于监控和健康检查

主要的代码都集中在上述树形结构中,下面依次讲解。

kube-dns

kube-dns是提供DNS功能的组件,我们重点关注。

首先看main方法:

func main() { config := options.NewKubeDNSConfig() config.AddFlags(pflag.CommandLine) flag.InitFlags() // Convinces goflags that we have called Parse() to avoid noisy logs. // OSS Issue: kubernetes/kubernetes#17162. goflag.CommandLine.Parse([]string{}) // 解析参数 logs.InitLogs() defer logs.FlushLogs() // 初始化日志 version.PrintAndExitIfRequested() glog.V(0).Infof("version: %+v", version.VERSION) // 实例化KubeDNSServer并运行 server := app.NewKubeDNSServerDefault(config) server.Run() } 

下面我们分析app包里的server.go文件

type KubeDNSServer struct { // DNS domain name. domain string healthzPort int dnsBindAddress string dnsPort int nameServers string kd *dns.KubeDNS } // KubeDNSServer类里前几个变量都是main函数里传递过来的参数直接赋值,没啥可讲的。kd是pkg/dns包里的KubeDNS类的实例,我们后续再讲。 func NewKubeDNSServerDefault(config *options.KubeDNSConfig) *KubeDNSServer {} // 根据参数,填充KubeDNSServer对象 func newKubeClient(dnsConfig *options.KubeDNSConfig) (kubernetes.Interface, error) {} // 根据参数,实例化一个与apiserver通信的client,有两种模式的client可以使用。集群内client(通过serviceAccount认证)以及集群外client(当前Kubernetes集群配置的其他认证方式进行认证) // main函数中的server.Run()调用的函数 func (server *KubeDNSServer) Run() { pflag.VisitAll(func(flag *pflag.Flag) { glog.V(0).Infof("FLAG: --%s=%q", flag.Name, flag.Value) }) setupSignalHandlers() // 监听系统事件,主要作用是等待日志处理完成 server.startSkyDNSServer() // 配置SkyDNS服务并启动服务,此处使用了SkyDNS的相关代码,这篇文章就不赘述了(我没看代码,囧) server.kd.Start() // 启动KubeDNS,后续再深入 server.setupHandlers() // 添加两个http方法,/readiness用于健康检查,/cache返回当前dns中缓存的dns记录JSON glog.V(0).Infof("Status HTTP port %v", server.healthzPort) if server.nameServers != "" { glog.V(0).Infof("Upstream nameservers: %s", server.nameServers) } glog.Fatal(http.ListenAndServe(fmt.Sprintf(":%d", server.healthzPort), nil)) // 监听http服务 } 

app/options包中还有个options.go文件,这里主要包含app需要的配置信息,不再赘述。下面我们跳入pkg/dns包中探一探究竟,首先入场(也是唯一入场)的是pkg/dns/dns.go

type KubeDNS struct { // 与apiserver通信的client kubeClient clientset.Interface // 域名,默认为cluster.local. domain string // configMap的名称,默认为空,使用命令行参数 configMap string // 存储集群中所有的endpoints endpointsStore kcache.Store // 存储集群中所有的services servicesStore kcache.Store // 存储集群中所有的nodes nodesStore kcache.Store // dns缓存 cache treecache.TreeCache // PTR记录 ip --> skymsg.Service reverseRecordMap map[string]*skymsg.Service // 集群服务列表 ip --> v1.Service clusterIPServiceMap map[string]*v1.Service // 缓存锁,更新上述三者的数据时,需加锁 cacheLock sync.RWMutex // 域名路径,是域名反向分割后的列表,比如默认的为[]string{"local", "cluster"} domainPath []string // endpointsController 管理endpoints的变更 endpointsController *kcache.Controller // serviceController 管理services的变更 serviceController *kcache.Controller // 配置对象 config *config.Config // 配置更新锁 configLock sync.RWMutex // 配置更新管理对象 configSync config.Sync // 初始化同步endpoints和services的过期时间 initialSyncTimeout time.Duration } func NewKubeDNS(client clientset.Interface, clusterDomain string, timeout time.Duration, configSync config.Sync) *KubeDNS {} // 根据参数配置KubeDNS对象,设置endpoint和service相关store和controller。 func (kd *KubeDNS) Start() {} // 启动KudeDNS,其实也就是启动在NewKubeDNS中设置的endpointsController和serviceController,并且监听配置文件的变化 func (kd *KubeDNS) GetCacheAsJSON() (string, error) {} // 获取dns缓存对象JSON,在cmd/app/server.go中被http方法/cache使用 func (kd *KubeDNS) setServicesStore() {} // 在NewKubeDNS中调用。监听service的变化,针对不同的操作(新增,删除,更新)执行不同的callback func (kd *KubeDNS) setEndpointsStore() {} // 在NewKubeDNS中调用。监听endpoint的变化,针对不同的操作(新增,删除,更新)执行不同的callback func (kd *KubeDNS) newService(obj interface{}) {} // 根据service的类型,生成不同类型的dns记录。简单的说,ExternalName类型的service是CNAME,只在dns缓存(KubeDNS.cache)中存储该记录;Headless(无ClusterIp)类型的service不在KubeDNS.clusterIPServiceMap中记录;而其他类型的service则在cache,reverseRecordMap,clusterIPServiceMap中一并存储 func (kd *KubeDNS) removeService(obj interface{}) {} // 删除service,也即删除在cache,reverseRecordMap,clusterIPServiceMap中的相关记录 func (kd *KubeDNS) updateService(oldObj, newObj interface{}) {} // 更新=删除+新增 func (kd *KubeDNS) handleEndpointAdd(obj interface{}) {} // 新增endpoints func (kd *KubeDNS) handleEndpointUpdate(oldObj, newObj interface{}) {} // 更新endpoints,删除新endpoints子网里跟老endpoints子网里一样的PTR记录(KubeDNS.reverseRecordMap),即删除相同ip的endpoint,然后调用handleEndpointAdd新增endpoints func (kd *KubeDNS) handleEndpointDelete(obj interface{}) {} // 删除相关的PTR记录(KubeDNS.reverseRecordMap)即可 func (kd *KubeDNS) addDNSUsingEndpoints(e *v1.Endpoints) error {} // 新增endpoints,如果endpoints对应的service是Headless service,则生成相关记录。如果不是,什么也不做。 func (kd *KubeDNS) getServiceFromEndpoints(e *v1.Endpoints) (*v1.Service, error) {} // 根据endpoints返回service func (kd *KubeDNS) fqdn(service *v1.Service, subpaths ...string) string {} // 生成一个完整网域名称(Fully qualified domain name) func (kd *KubeDNS) newPortalService(service *v1.Service) {} // 生成portalService,我的理解是一般类型的service,同时在cache,reverseRecordMap,clusterIPServiceMap中存储该service的记录 func (kd *KubeDNS) generateRecordsForHeadlessService(e *v1.Endpoints, svc *v1.Service) error {} // 生成headlessService,同时在cache,reverseRecordMap中存储该service的记录 func (kd *KubeDNS) newExternalNameService(service *v1.Service) {} // 生成ExternalNameService,只在cache中记录该条信息 func (kd *KubeDNS) Records(name string, exact bool) (retval []skymsg.Service, err error) {} // 查询DNS记录,参数中的exact标识是否精确匹配。其中federation相关的东西我还不是太明白 func (kd *KubeDNS) ReverseRecord(name string) (*skymsg.Service, error) {} // 查询PTR记录 

Records 和 ReverseRecord 两个方法是实现了skydns的Backend接口,这样的话,KubeDNS就可以作为skydns的后端存储提供dns查询服务了,二者怎么关联起来的呢?回看cmd/kube-dns/app/server.go文件里的startSkyDNSServer方法,你会找到汇合点的,试试看吧。

至此,我们对kubeDNS组件有了初步大概的认识。接下来,我们再接着看dnsmasq组件。

dnsmasq

cmd/dnsmasq-nanny没有什么可以讲的,也就是解析命令行参数然后调用pkg/dnsmasq/nanny.go的RunNanny方法。或者可以这么说,整个dnsmasq就没什么事,就是在其中内嵌了dnsmasql应用程序,通过代码启动并管理该程序的生命进程

// RunNanny runs the nanny and handles configuration updates. func RunNanny(sync config.Sync, opts RunNannyOpts) { defer glog.Flush() currentConfig, err := sync.Once() if err != nil { glog.Errorf("Error getting initial config, using default: %v", err) currentConfig = config.NewDefaultConfig() } // 解析配置 nanny := &Nanny{Exec: opts.DnsmasqExec} nanny.Configure(opts.DnsmasqArgs, currentConfig) if err := nanny.Start(); err != nil { glog.Fatalf("Could not start dnsmasq with initial configuration: %v", err) } // 启动dnsmasq应用程序 configChan := sync.Periodic() for { select { case status := <-nanny.ExitChannel: glog.Flush() glog.Fatalf("dnsmasq exited: %v", status) break case currentConfig = <-configChan: if opts.RestartOnChange { glog.V(0).Infof("Restarting dnsmasq with new configuration") nanny.Kill() nanny = &Nanny{Exec: opts.DnsmasqExec} nanny.Configure(opts.DnsmasqArgs, currentConfig) nanny.Start() } else { glog.V(2).Infof("Not restarting dnsmasq (--restartDnsmasq=false)") } break } } // 持续监听退出状态和配置更新 } func (n *Nanny) Kill() error {} // 杀掉运行中的dnsmasq进程 func (n *Nanny) Start() error {} // 启动dnsmasq进程,并将日志信息输出到glog func (n *Nanny) Configure(args []string, config *config.Config) {} // 解析配置,必须在Start方法前调用 

dnsmasq的另一部分的作用是从dnsmasq应用程序读取监控信息,包括缓存命中数量,缓存未命中数量,缓存删除数量,缓存插入数量,缓存大小等信息。

sidecar

sidecar组件的主要作用是提供kube-dns和dnsmasq的健康检查和dns的监控。我们略过cmd/sidecar/main.go,他的主要作用也无非是解析参数。我们重点关注pkg/sidecar/server.go

func (s *server) Run(options *Options) { s.options = options glog.Infof("Starting server (options %+v)", *s.options) // 之前说sidecar监控kube-dns和dnsmasq,其实是通过参数传递进来的,具体的参数解析可以参考cmd/sidecar/main.go for _, probeOption := range options.Probes { probe := &dnsProbe{DNSProbeOption: probeOption} s.probes = append(s.probes, probe) probe.Start(options) // 启动组件健康检查 } s.runMetrics(options) // dns监控信息 }

本文转自中文社区-容器编排Kubernetes之kube-dns源码解读

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。 &nbsp; &nbsp; 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
10月前
|
Kubernetes Docker Python
Docker 与 Kubernetes 容器化部署核心技术及企业级应用实践全方案解析
本文详解Docker与Kubernetes容器化技术,涵盖概念原理、环境搭建、镜像构建、应用部署及监控扩展,助你掌握企业级容器化方案,提升应用开发与运维效率。
1285 108
|
9月前
|
Kubernetes Devops Docker
Kubernetes 和 Docker Swarm:现代 DevOps 的理想容器编排工具
本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具,涵盖安装、架构、网络、监控等核心维度,助您根据团队能力与业务需求精准选型,把握云原生时代的技术主动权。
780 115
|
9月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
911 3
|
11月前
|
NoSQL Redis Docker
使用Docker Compose工具进行容器编排的教程
以上就是使用Docker Compose进行容器编排的基础操作。这能帮你更有效地在本地或者在服务器上部署和管理多容器应用。
790 11
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
342 1
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
443 0
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
|
监控 Kubernetes Cloud Native
基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践
本文介绍了如何基于阿里云容器服务Kubernetes版(ACK)设计和实现微服务架构。首先概述了微服务架构的优势与挑战,如模块化、可扩展性及技术多样性。接着详细描述了ACK的核心功能,包括集群管理、应用管理、网络与安全、监控与日志等。在设计基于ACK的微服务架构时,需考虑服务拆分、通信、发现与负载均衡、配置管理、监控与日志以及CI/CD等方面。通过一个电商应用案例,展示了用户服务、商品服务、订单服务和支付服务的具体部署步骤。最后总结了ACK为微服务架构提供的强大支持,帮助应对各种挑战,构建高效可靠的云原生应用。
|
存储 运维 Kubernetes
容器数据保护:基于容器服务 Kubernetes 版(ACK)备份中心实现K8s存储卷一键备份与恢复
阿里云ACK备份中心提供一站式容器化业务灾备及迁移方案,减少数据丢失风险,确保业务稳定运行。