nacos服务注册剖析

简介: nacos服务注册剖析

最近正在负责将公司内部的服务注册中心做转移工作,正准备切入到nacos注册中心,于是花了些时间去整理学习关于使用nacos的一些笔记,并进行一番文档的输出。


使用版本 nacos-1.1.4版本


nacos注册中心的简单介绍


nacos其实是一款阿里巴巴开源的注册中心+配置中心,除此之外nacos还有很多强大的功能。


nacos的文件目录


在nacos安装包底下,我们可以大概看到nacos包含了以下几类文件夹,不同的文件底下存储了不同的数据信息。


网络异常,图片无法展示
|


最后在target文件夹底下发现了nacos的jar包,因此我好奇地将其打开来一探究竟。

发现内部的jar将nacos的管理台源代码给打包了一份。


通过阅读源码发现在工程的内部有个lib目录文件夹,这里面似乎有自己希望找到的内容


网络异常,图片无法展示
|


但是目前还是没法看到内部的源码,在工程的外部主要就是结合一些源码的api做了一套可视化界面的控制台。


这里面有份jar命名为:nacos-server.jar。


在startup.sh脚本里面可以看到,nacos有着对应的脚本细节:


网络异常,图片无法展示
|


这里对应了java -jar的命令关键行进行控制台的启动:


网络异常,图片无法展示
|


配置中心源码分析


如何进行本地源码的debug


选择Nacos工程,然后设置对应的启动参数:


-Dnacos.standalone=true -Dnacos.home=F:\nacos-local-config
复制代码


网络异常,图片无法展示
|


从github下载一份nacos的源码之后可以看到内部的基础结构为:


网络异常,图片无法展示
|


整体项目里面对应的工程有好几个,这里我们选择了Config工程这个模块进行分析,因为这里面包含了nacos控制台中的拉去服务详情,查看配置列表等常用接口,有助于我们对工作中常用功能的深入理解。


参照控制台的接口路径很快能定位到controller内容


下边这段接口是对应了查看配置属性的内容:


http://127.0.0.1:8848/nacos/v1/cs/configs?search=accurate&accessToken=eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJuYWNvcyIsImV4cCI6MTU5MDE1MzAwM30.
TFlSFPTzKd0-2zmmsFjnghV74JfL_tWwo6BOFYAfdjk&dataId&group&pageNo=1&pageSize=10
复制代码


配置信息查询接口对应源代码:


com.alibaba.nacos.config.server.controller.ConfigController#searchConfig --->
com.alibaba.nacos.config.server.service.repository.PersistService#findConfigInfo4Page
复制代码


在com.alibaba.nacos.config.server.service.repository.EmbeddedStoragePersistServiceImpl#findConfigInfo4Page


里面看到有关于sql的查询,深入内部去查看:


单机版本的nacos使用的是 derby 数据库进行配置存储的持久化


网络异常,图片无法展示
|


具体的初始化步骤位于:

com.alibaba.nacos.config.server.service.datasource.LocalDataSourceServiceImpl#init


初始化的时候会链接本地数据库:

jdbc:derby:F:\nacos-local-config\data\derby-data;create=true


网络异常,图片无法展示
|


单机版本的nacos重启之后数据并不会丢失,依旧是从本地的存储文件中读取数据信息。

derby数据库的介绍


官网地址:db.apache.org/derby/


一款java语言编写的内嵌于jvm的数据库,可以支持sql查询,以及jdbc协议,关于其持久化,大概推断是存储到了指定的目录文件下边:


网络异常,图片无法展示
|


服务列表源码分析


服务注册原理跟踪

根据debug会发现,在com.alibaba.nacos.naming.core.ServiceManager 类里面包含了相关的服务列表存储信息:


网络异常,图片无法展示
|


在源码里面会发现存储这些服务列表的本质就是一个ConcurrentHashMap数据结构:

(采用了ConcurrentHashMap来解决并发冲突问题,1.8之前是采用了分段锁,但是这种方式的锁粒度过大,所以后边改为了采用cas+synchronized的方式来进行加锁,通过使用无所插入头结点,如果插入失败,说明同一时刻有其他线程进行头插入,再次循坏插入)


private Map<String, Map<String, Service>> serviceMap = new ConcurrentHashMap<>();
复制代码


有点奇怪,这个map的数据是存储在内存里面的,那么服务在重启的时候应该是有进行初始化操作。并且当我们将provider的服务下架之后nacos依旧会有服务信息,在服务关闭之后的三十秒后nacos就查询不出任何信息了。


借此推测会有一个调度去专门维护这些数据信息。(猜测是心跳机制)

注册服务信息到nacos的接口:


/nacos/v1/ns/instance
com.alibaba.nacos.naming.controllers.InstanceController#register
->
com.alibaba.nacos.naming.core.ServiceManager#registerInstance
复制代码


那么,假设我们通过启动dubbo工程,注册dubbo服务到nacos服务中心之后会看到哪些情况呢?


发现循环调用某些接口


【DistroFilter request url】/nacos/v1/ns/instance/beat

【DistroFilter request url】/nacos/v1/ns/instance/list


通过日志过滤发现会循环调用这两个接口,后来查询文档估计是某些调度在维护两端的数据。


客户端会重复发送心跳包到nacos这边,这份心跳包包含的数据还挺多的。关于心跳模块涉及到的类为:


com.alibaba.nacos.client.naming.beat.BeatReactor
复制代码


发送的心跳数据基本格式通过BeatInfo格式进行数据传输。


关于循环发送心跳数据包的核心是借助了jdk内部的


ScheduledExecutorService
复制代码


这个api来实现的,相关模板代码:


网络异常,图片无法展示
|


这样就能实现每个三秒发送一次心跳的功能。


同理,在nacos的服务端和客户端之间也存在心跳协调的代码:


class BeatTask implements Runnable {
        BeatInfo beatInfo;
        public BeatTask(BeatInfo beatInfo) {
            this.beatInfo = beatInfo;
        }
        @Override
        public void run() {
            if (beatInfo.isStopped()) {
                return;
            }
            long nextTime = beatInfo.getPeriod();
            try {
            //发送心跳包
                JSONObject result = serverProxy.sendBeat(beatInfo, BeatReactor.this.lightBeatEnabled);
                long interval = result.getIntValue("clientBeatInterval");
                boolean lightBeatEnabled = false;
                if (result.containsKey(CommonParams.LIGHT_BEAT_ENABLED)) {
                    lightBeatEnabled = result.getBooleanValue(CommonParams.LIGHT_BEAT_ENABLED);
                }
                BeatReactor.this.lightBeatEnabled = lightBeatEnabled;
                if (interval > 0) {
                    nextTime = interval;
                }
                int code = NamingResponseCode.OK;
                if (result.containsKey(CommonParams.CODE)) {
                    code = result.getIntValue(CommonParams.CODE);
                }
                if (code == NamingResponseCode.RESOURCE_NOT_FOUND) {
                //如果服务实例消失或者不存在,则注册一个服务实例
                    Instance instance = new Instance();
                    instance.setPort(beatInfo.getPort());
                    instance.setIp(beatInfo.getIp());
                    instance.setWeight(beatInfo.getWeight());
                    instance.setMetadata(beatInfo.getMetadata());
                    instance.setClusterName(beatInfo.getCluster());
                    instance.setServiceName(beatInfo.getServiceName());
                    instance.setInstanceId(instance.getInstanceId());
                    instance.setEphemeral(true);
                    try {
                        serverProxy.registerService(beatInfo.getServiceName(),
                            NamingUtils.getGroupName(beatInfo.getServiceName()), instance);
                    } catch (Exception ignore) {
                    }
                }
            } catch (NacosException ne) {
                NAMING_LOGGER.error("[CLIENT-BEAT] failed to send beat: {}, code: {}, msg: {}",
                    JSON.toJSONString(beatInfo), ne.getErrCode(), ne.getErrMsg());
            }
            //每隔5秒重新发送一次心跳包
            executorService.schedule(new BeatTask(beatInfo), nextTime, TimeUnit.MILLISECONDS);
        }
    }
复制代码


其实我们深入sendbeat函数可以看到最底层就是请求nacos服务端的心跳接口


public JSONObject sendBeat(BeatInfo beatInfo, boolean lightBeatEnabled) throws NacosException {
        if (NAMING_LOGGER.isDebugEnabled()) {
            NAMING_LOGGER.debug("[BEAT] {} sending beat to server: {}", namespaceId, beatInfo.toString());
        }
        Map<String, String> params = new HashMap<String, String>(8);
        String body = StringUtils.EMPTY;
        if (!lightBeatEnabled) {
            try {
                body = "beat=" + URLEncoder.encode(JSON.toJSONString(beatInfo), "UTF-8");
            } catch (UnsupportedEncodingException e) {
                throw new NacosException(NacosException.SERVER_ERROR, "encode beatInfo error", e);
            }
        }
        params.put(CommonParams.NAMESPACE_ID, namespaceId);
        params.put(CommonParams.SERVICE_NAME, beatInfo.getServiceName());
        params.put(CommonParams.CLUSTER_NAME, beatInfo.getCluster());
        params.put("ip", beatInfo.getIp());
        params.put("port", String.valueOf(beatInfo.getPort()));
        String result = reqAPI(UtilAndComs.NACOS_URL_BASE + "/instance/beat", params, body, HttpMethod.PUT);
        return JSON.parseObject(result);
    }
复制代码


结合springboot的starter如何做服务发现


首先你可能会有思路推断,加入了一个starter就能生效,估计是有什么springboot的自动化配置在生效吧。


springboot也有自己的一套spi机制,将spirng.factories配置文件下的类进行实例化操作。


网络异常,图片无法展示
|


然后根据这些配置的类进行初始化操作。


这里面有个 NacosServiceRegistryAutoConfiguration 类


参考源代码:


com.alibaba.cloud.nacos.registry.NacosServiceRegistryAutoConfiguration
com.alibaba.cloud.nacos.registry.NacosAutoServiceRegistration
org.springframework.cloud.client.serviceregistry.AbstractAutoServiceRegistration
复制代码


这个类里面继承类spring的事件,ApplicationListener,当spring容器启动的时候会去触发onApplicationEvent函数的。


bind(event)-->start --> register--> com.alibaba.nacos.api.naming.NamingService#registerInstance(java.lang.String, java.lang.String, com.alibaba.nacos.api.naming.pojo.Instance)
复制代码


其实本质就是在这里调用类nacos的一个远程方法,关于nacos的远程方法看看源码包就了解了,这个不难。


注册的参数


private Instance getNacosInstanceFromRegistration(Registration registration) {
   Instance instance = new Instance();
   instance.setIp(registration.getHost());
   instance.setPort(registration.getPort());
   instance.setWeight(nacosDiscoveryProperties.getWeight());
   instance.setClusterName(nacosDiscoveryProperties.getClusterName());
   instance.setMetadata(registration.getMetadata());
   return instance;
}
复制代码


整体的注册源码其实可以浓缩为下边这张图


网络异常,图片无法展示
|


nacos的集群化


基本配置条件:


一般集群需要至少3个节点。我们先准备3台机器,我这里选择了三台机器作为集群搭建基础:


192.168.11.200:8748
192.168.11.196:8748
192.168.11.126:8748
复制代码


首先需要有三台基本的服务器用于运行多个nacos服务端程序。

然后修改conf配置文件:


[root@localhost conf]# ls
application.properties  application.properties.example  cluster.conf  cluster.conf.example.bak  nacos-logback.xml  nacos-mysql.sql  schema.sql
[root@localhost conf]# cat cluster.conf
#it is ip
#example
192.168.164.131:8848
192.168.164.132:8848
192.168.164.133:8848
复制代码


最后再配置一下数据库连接部分:


### Count of DB:
 db.num=1
### Connect URL of DB:
 db.url.0=jdbc:mysql://10.11.9.243:3306/linhao_test?characterEncoding=utf8&connectTimeout=1000&socketTimeout=3000&autoReconnect=true
 db.user=crm
 db.password=USszJ497whda
复制代码


启动之后日志会有明显说明提示nacos的集群已经部署成功。


如果需要方便操作可以借助使用nginx来做页面的转发。


upstream nacos_server {
  server 192.168.11.200:8748;
  server 192.168.11.196:8748;
  server 192.168.11.126:8748;
}
server {
  listen 80;
  server_name localhost;
  #charset koi8-r;
  #access_log logs/host.access.log main;
  location / {
    proxy_pass http://nacos_server;
    index index.html index.htm;
  }
}
复制代码


初始化登录账号


登录账号可以从源码里面翻查,然后根据这里的加密方式在数据库里面设置账号信息:


package com.alibaba.nacos.console.utils;
import org.springframework.security.crypto.bcrypt.BCryptPasswordEncoder;
/**
 * Password encoder tool
 *
 * @author nacos
 */
public class PasswordEncoderUtil {
    public static void main(String[] args) {
        System.out.println(new BCryptPasswordEncoder().encode("nacos"));
    }
    public static Boolean matches(String raw, String encoded) {
        return new BCryptPasswordEncoder().matches(raw, encoded);
    }
    public static String encode(String raw) {
        return new BCryptPasswordEncoder().encode(raw);
    }
}
复制代码


下边这段是nacos初始化时候给定的账号密码:


INSERT INTO users (username, password, enabled) VALUES ('nacos', '$2a$10$EuWPZHzz32dJN7jexM34MOeYirDdFAZm2kuWj7VEOJhhZkDrxfvUu', TRUE);
INSERT INTO roles (username, role) VALUES ('nacos', 'ROLE_ADMIN');
复制代码


经过检测,不同账号登录nacos看到的基础配置信息大多都是相似的。


网络异常,图片无法展示
|


nacos里面的日志输出在nacos-logback.xml 配置了日志输出位置和等级,如果需要跟踪或者调整可以进去进行修改。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
2月前
|
缓存 安全 Nacos
nacos常见问题之服务一直在报token expired!如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
97 0
|
5天前
|
安全 Linux Nacos
如何使用公网地址远程访问内网Nacos UI界面查看注册服务
如何使用公网地址远程访问内网Nacos UI界面查看注册服务
16 0
|
18天前
|
负载均衡 Cloud Native Java
Nacos 注册中心(2023旧笔记)
Nacos 注册中心(2023旧笔记)
18 0
|
1月前
|
Dubbo Java 应用服务中间件
深度剖析:Dubbo使用Nacos注册中心的坑
2020年笔者在做微服务部件升级时,Dubbo的注册中心从Zookeeper切换到Nacos碰到个问题,最近刷Github又有网友提到类似的问题,就在这篇文章里做个梳理和总结。
深度剖析:Dubbo使用Nacos注册中心的坑
|
1月前
|
SpringCloudAlibaba Java Nacos
SpringCloud Alibaba微服务 -- Nacos使用以及注册中心和配置中心的应用(保姆级)
SpringCloud Alibaba微服务 -- Nacos使用以及注册中心和配置中心的应用(保姆级)
|
1月前
|
Dubbo Java 应用服务中间件
双活工作下的数据迁移:Nacos注册中心实战解析
这篇内容介绍了如何使用NacosSync组件进行双活项目中的注册中心数据迁移。首先,准备包括64位OS、JDK 1.8+、Maven 3.2+和MySQL 5.6+的环境。接着,获取并解压NacosSync安装包,配置数据库连接,启动服务,并通过访问特定URL检查系统状态。然后,通过NacosSync控制台进行集群配置,添加Zookeeper和Nacos集群,并设置同步任务。当数据同步完成后,Dubbo客户端(Consumer和Provider)更新配置以连接Nacos注册中心。最后,迁移完成后,原有的Zookeeper集群可下线,整个过程确保了服务的平滑迁移。
40 1
|
2月前
|
XML Dubbo Java
【Dubbo3高级特性】「框架与服务」 Nacos作为注册中心-服务分组及服务分组聚合实现
【Dubbo3高级特性】「框架与服务」 Nacos作为注册中心-服务分组及服务分组聚合实现
64 0
|
2月前
|
关系型数据库 MySQL Nacos
【深入浅出Nacos原理及调优】「实战开发专题」采用Docker容器进行部署和搭建Nacos服务以及“坑点”
【深入浅出Nacos原理及调优】「实战开发专题」采用Docker容器进行部署和搭建Nacos服务以及“坑点”
57 1
|
2月前
|
运维 Kubernetes Nacos
nacos常见问题之服务注册IP白名单如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
31 0
|
2月前
|
安全 前端开发 Nacos
nacos常见问题之配置注册的白名单如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
120 0