分布式架构与Dubbo基础入门与实践

本文涉及的产品
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
简介: 分布式架构与Dubbo基础入门与实践

【1】分布式系统

① 什么是分布式系统

《分布式系统原理与范型》定义:“分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统”。

分布式系统(distributed system)是建立在网络之上的软件系统。

随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。


② 架构发展演变

如下图所示:

  • 单一应用架构

当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于简化增删改查工作量的数据访问框架(ORM)是关键。

适用于小型网站,小型管理系统,将所有功能都部署到一个功能里,简单易用。

缺点: 1、性能扩展比较难 ;2、协同开发问题; 3、不利于升级维护。


  • 垂直应用架构

当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用,以提升效率。此时,用于加速前端页面开发的Web框架(MVC)是关键。

通过切分业务来实现各个模块独立部署,降低了维护和部署的难度,团队各司其职更易管理,性能扩展也更方便,更有针对性。

缺点: 公用模块无法重复利用,开发性的浪费。


  • 分布式服务架构

当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的分布式服务框架(RPC)是关键。


  • 流动计算架构

当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容量,提高集群利用率。此时,用于提高机器利用率的资源调度和治理中心(SOA)[ Service Oriented Architecture]是关键。

即,通常分布式应用就是面向服务的分布式架构。


③ RPC

  • 什么叫RPC

RPC(Remote Procedure Call)是指远程过程调用,是一种进程间通信方式,他是一种技术的思想,而不是规范。它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数,而不用程序员显式编码这个远程调用的细节。即程序员无论是调用本地的还是远程的函数,本质上编写的调用代码基本相同。

  • RPC基本原理


时序图如下:


可以发现RPC两个核心模块:通讯和序列化。

常见的RPC框架有:Dubbo、GRPC(谷歌)、Thrift(Facebook)、HSF(High Speed Service Framework 阿里)、JSF(京东)及Motan(新浪)。

【2】Dubbo

Apache Dubbo (incubating) 是一款高性能、轻量级的开源Java RPC框架,它提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现

官网地址:http://dubbo.apache.org/

官网开发文档:http://dubbo.apache.org/zh-cn/docs/user/preface/


Dubbo的官方用户文档提供了很详细的使用说明与实例,遇到问题请一定参考官网文档!

① 结构示意图

如下所示(012345表示执行顺序,实线表示同步,虚线表示异步):

特性如下:

  • 面向接口代理的高性能RPC调用:提供高性能的基于代理的远程调用能力,服务以接口为粒度,为开发者屏蔽远程调用底层细节。
  • 智能负载均衡:内置多种负载均衡策略,智能感知下游节点健康状况,显著减少调用延迟,提高系统吞吐量。
  • 服务自动注册与发现:支持多种注册中心服务,服务实例上下线实时感知。
  • 高度可扩展能力:遵循微内核+插件的设计原则,所有核心能力如Protocol、Transport、Serialization被设计为扩展点,平等对待内置实现和第三方实现。
  • 运行期流量调度:内置条件、脚本等路由策略,通过配置不同的路由规则,轻松实现灰度发布,同机房优先等功能。
  • 可视化的服务治理与运维:提供丰富服务治理、运维工具–随时查询服务元数据、服务健康状态及调用统计,实时下发路由策略、调整配置参数。

② 几个概念

服务提供者(Provider):暴露服务的服务提供方,服务提供者在启动时,向注册中心注册自己提供的服务。

服务消费者(Consumer): 调用远程服务的服务消费方,服务消费者在启动时,向注册中心订阅自己所需的服务。服务消费者从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。

注册中心(Registry):注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。

监控中心(Monitor):服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。


③ 调用关系说明

  • 服务容器负责启动,加载,运行服务提供者。
  • 服务提供者在启动时,向注册中心注册自己提供的服务。
  • 服务消费者在启动时,向注册中心订阅自己所需的服务。
  • 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。
  • 服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
  • 服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心(monitor)。

【3】Zookeeper注册中心

Dubbo推荐使用Zookeeper作为注册中心,当然Dubbo还支持其他作为注册中心如Multicast 注册中心,Redis注册中心和Simple 注册中心(本身就是一个普通的 Dubbo 服务)。

① 核心概念

Zookeeper 是 Apacahe Hadoop 的子项目,是一个树型的目录服务,支持变更推送,适合作为 Dubbo 服务的注册中心,工业强度较高,可用于生产环境,并推荐使用。

官网地址:http://zookeeper.apache.org/

下载地址:https://archive.apache.org/dist/zookeeper/


② 流程说明:

  • 服务提供者启动时: 向 /dubbo/com.foo.BarService/providers 目录下写入自己的 URL 地址
  • 服务消费者启动时: 订阅 /dubbo/com.foo.BarService/providers 目录下的提供者 URL 地址。并向 /dubbo/com.foo.BarService/consumers 目录下写入自己的 URL 地址
  • 监控中心启动时: 订阅 /dubbo/com.foo.BarService 目录下的所有提供者和消费者 URL 地址。

③ 支持以下功能:

  • 当提供者出现断电等异常停机时,注册中心能自动删除提供者信息;
  • 当注册中心重启时,能自动恢复注册数据,以及订阅请求;
  • 当会话过期时,能自动恢复注册数据,以及订阅请求;
  • 当设置 <dubbo:registry check="false" />时,记录失败注册和订阅请求,后台定时重试;
  • 可通过 <dubbo:registry username="admin" password="1234" /> 设置 zookeeper 登录信息
  • 可通过 <dubbo:registry group="dubbo" /> 设置 zookeeper 的根节点,不设置将使用无根树
  • 支持 *号通配符<dubbo:reference group="*" version="*" />,可订阅服务的所有分组和所有版本的提供者

更多详情参考:Dubbo官网文档。


④ Windows下简单搭建Zookeeper

将下载好的Zookeeper解压到本地目录下,并修改zoo.cfg配置文件。

步骤如下:

  • 解压运行bin/zkServer.cmd ,初次运行会报错,没有zoo.cfg配置文件;
  • 将conf下的zoo_sample.cfg复制一份改名为zoo.cfg即可。

注意几个重要位置:

dataDir=./   临时数据存储的目录(可写相对路径)
clientPort=2181   zookeeper的默认端口号
  • 修改完成后再次启动zookeeper
  • 使用zkCli.cmd测试
ls /:列出zookeeper根下保存的所有节点
create –e  /myzookeeper 123:创建一个myzookeeper 节点,值为123
get /myzookeeper :获取/myzookeeper 节点的值

服务端启动示意图如下:

客户端测试如下:



【4】Windows下安装Dubbo管理控制台

dubbo本身并不是一个服务软件。它其实就是一个jar(2.6之后为jar,之前为war需要在Tomcat下运行)包能够帮你的java程序连接到zookeeper,并利用zookeeper消费、提供服务。所以你不用在Linux上启动什么dubbo服务。

但是为了让用户更好的管理监控众多的dubbo服务,官方提供了一个可视化的监控程序,不过这个监控即使不装也不影响使用。

安装步骤如下:

  • 进入Dubbo的GitHub项目项目地址;
  • 在最下方Dubbo eco system中点击进入Dubbo-OPS;
  • Download ZIP并解压到本地


进入目录,修改dubbo-admin配置

修改 src\main\resources\application.properties 指定zookeeper地址:

dubbo.registry.address=zookeeper://127.0.0.1:2181

打包dubbo-adminmvn clean package -Dmaven.test.skip=true

D:\Java_Tomcat_MySQL_jdk_zip\incubator-dubbo-ops-master\dubbo-admin>mvn clean package -Dmaven.test.skip=true
//D:\Java_Tomcat_MySQL_jdk_zip\incubator-dubbo-ops-master 为项目路径

打包成功如下图所示:


  • 使用命令运行jarjava -jar dubbo-admin-0.0.1-SNAPSHOT.jar
  • 浏览器访问(http://localhost:7001/)默认用户名密码root/root


Dubbo OPS项目与管理后台jar包下载:点击下载。


【5】服务器提供者/消费者项目简单实践

① 简单需求

某个电商系统,订单服务需要调用用户服务获取某个用户的所有地址。

我们现在 需要创建两个服务模块进行测试 :

image.png

测试预期结果:订单服务模块在A服务器,用户服务模块在B服务器,A可以远程调用B的功能。

② 创建服务提供者和消费者

如下所示,创建两个maven工程,分别表示provider和consumer:


那消费者如何调用provider的方法呢?这里如果将provider依赖进consumer,则就成了单体应用。

或者可以这样,将provider的bean和service拷贝到consumer中,如下所示:


该种方式项目实例参考SpringBoot整合Dubbo和Zookeeper。

这种方式是有问题:第一,暂且不说现在OrderServiceImpl调用UserService肯定失败(实现类在另外一个项目);第二,UserService可能会被多个模块调用,原则上不应该每个调用UserService的模块都添加bean和UserService接口,添麻烦。而且也不符合Dubbo的服务化最佳实践


这里将bean和接口抽离出来放在一个公共API项目中,provider和consumer依赖该项目。如下所示:

现在需要解决的问题就是远程调用,OrderServiceImpl如何调用userService.getUserAddressList(userId);


③ Dubbo改造服务提供者

第一步:引入依赖:

<!-- 引入dubbo -->
  <!-- https://mvnrepository.com/artifact/com.alibaba/dubbo -->
  <dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>dubbo</artifactId>
    <version>2.6.2</version>
  </dependency>
  <!-- 注册中心使用的是zookeeper,引入操作zookeeper的客户端端 -->
  <dependency>
    <groupId>org.apache.curator</groupId>
    <artifactId>curator-framework</artifactId>
    <version>2.12.0</version>
  </dependency>

dubbo 2.6以前的版本引入zkclient操作zookeeper ,dubbo 2.6及以后的版本引入curator操作zookeeper。

下面两个zk客户端根据dubbo版本2选1即可:

<dependency>
  <groupId>com.101tec</groupId>
  <artifactId>zkclient</artifactId>
  <version>0.10</version>
</dependency>
<!-- curator-framework -->
<dependency>
  <groupId>org.apache.curator</groupId>
  <artifactId>curator-framework</artifactId>
  <version>2.12.0</version>
</dependency>

第二步,配置服务

在provider类路径下添加配置文件provider.xml:

  <!-- 1、指定当前服务/应用的名字(同样的服务名字相同,不要和别的服务同名) -->
  <dubbo:application name="user-service-provider"></dubbo:application>
  <!-- 2、指定注册中心的位置 -->
  <!-- <dubbo:registry address="zookeeper://127.0.0.1:2181"></dubbo:registry> -->
  <dubbo:registry protocol="zookeeper" address="127.0.0.1:2181"></dubbo:registry>
  <!-- 3、指定通信规则(通信协议?通信端口) -->
  <dubbo:protocol name="dubbo" port="20882"></dubbo:protocol>
  <!-- 4、暴露服务   ref:指向服务的真正的实现对象 -->
  <dubbo:service interface="com.web.gmall.service.UserService" 
    ref="userServiceImpl" >
    <dubbo:method name="getUserAddressList" timeout="1000"></dubbo:method>
  </dubbo:service>
  <!--统一设置服务提供方的规则  -->
  <dubbo:provider timeout="1000"></dubbo:provider>
  <!-- 服务的实现 -->
  <bean id="userServiceImpl" class="com.web.gmall.service.impl.UserServiceImpl"></bean>

第三步,编写主类进行测试

public class MainApplication {
  public static void main(String[] args) throws IOException {
    ClassPathXmlApplicationContext ioc = new ClassPathXmlApplicationContext("provider.xml");
    ioc.start();
    System.in.read();
  }
}

使用Dubbo Admin管理后台查看,可以发现已经新增了一个服务提供者:


④ Dubbo改造服务消费者

第一步:引入依赖:

<!-- 引入dubbo -->
  <!-- https://mvnrepository.com/artifact/com.alibaba/dubbo -->
  <dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>dubbo</artifactId>
    <version>2.6.2</version>
  </dependency>
  <!-- 注册中心使用的是zookeeper,引入操作zookeeper的客户端端 -->
  <dependency>
    <groupId>org.apache.curator</groupId>
    <artifactId>curator-framework</artifactId>
    <version>2.12.0</version>
  </dependency>

第二步,配置服务

在消费者class资源路径下配置consumer.xml:

    <context:component-scan base-package="com.web.gmall.service.impl"></context:component-scan>
  <dubbo:application name="order-service-consumer"></dubbo:application>
  <dubbo:registry address="zookeeper://127.0.0.1:2181"></dubbo:registry>
  <!--声明需要调用的远程服务的接口;生成远程服务代理  -->
  <dubbo:reference interface="com.web.gmall.service.UserService" 
    id="userService" >
  </dubbo:reference>

第三步,编写主类进行测试

public class MainApplication {
  @SuppressWarnings("resource")
  public static void main(String[] args) throws IOException {
    ClassPathXmlApplicationContext applicationContext = new ClassPathXmlApplicationContext("consumer.xml");
    OrderService orderService = applicationContext.getBean(OrderService.class);
    orderService.initOrder("1");
    System.out.println("调用完成....");
    System.in.read();
  }
}

在保证Zookeeper服务端,Dubbo Admin和服务器提供者启动并正常运行前提下,运行该消费者主类,将会从服务提供者那里获取数据!

使用Dubbo Admin后台查看:

截止现在,Dubbo+Zookeeper简单整合实践,源码下载地址。


【6】安装Monitor监控中心

Simple Monitor 挂掉不会影响到 Consumer 和 Provider 之间的调用,所以用于生产环境不会有风险。

Simple Monitor 采用磁盘存储统计信息,请注意安装机器的磁盘限制,如果要集群,建议用mount共享磁盘。

① 安全并运行Monitor

和安装Dubbo Admin时步骤类似,进入incubator-dubbo-ops-master\dubbo-monitor-simple目录下,使用maven命令进行打包:

mvn clean package -Dmaven.test.skip=true

这里运行jar前,需要查看一下配置文件。将dubbo-monitor-simple-2.0.0-assembly.tar.gz复制并解压到指定文件夹下,查看其conf目录下的配置文件:

// Zookeeper注册中心地址
dubbo.registry.address=zookeeper://127.0.0.1:2181
//监控中心于其他服务通信端口
dubbo.protocol.port=7070
//监控中心web页面访问端口
dubbo.jetty.port=8080

之后,进入dubbo-monitor-simple-2.0.0\assembly.bin目录,运行start.bat。

进入浏览器查看监控中心:


此时监控中心还没有消费者。


② 修改服务提供者/消费者配置

在consumer.xml中添加如下配置:

<dubbo:monitor protocol="registry"></dubbo:monitor>

在provider.xml中如下配置:

<dubbo:monitor address="127.0.0.1:7070"></dubbo:monitor>


这两种有什么区别?参考官方文档:



重新启动provider和consumer,提供者向消费者索取服务再次查看Monitor,将会发现com.alibaba.dubbo.monitor.MonitorService对应的consumer有两个:provider和consumer都是MonitorService的消费者!


项目GitHub地址:点击下载


目录
相关文章
|
1月前
|
人工智能 安全 Java
分布式 Multi Agent 安全高可用探索与实践
在人工智能加速发展的今天,AI Agent 正在成为推动“人工智能+”战略落地的核心引擎。无论是技术趋势还是政策导向,都预示着一场深刻的变革正在发生。如果你也在探索 Agent 的应用场景,欢迎关注 AgentScope 项目,或尝试使用阿里云 MSE + Higress + Nacos 构建属于你的 AI 原生应用。一起,走进智能体的新世界。
466 41
|
1月前
|
数据采集 监控 API
移动端性能监控探索:iOS RUM SDK 技术架构与实践
阿里云 RUM SDK 作为一款性能体验监控采集工具,可以作为辅助 App 运维的强有力助手,提升您的问题排查效率。
207 13
|
1月前
|
关系型数据库 Apache 微服务
《聊聊分布式》分布式系统基石:深入理解CAP理论及其工程实践
CAP理论指出分布式系统中一致性、可用性、分区容错性三者不可兼得,必须根据业务需求进行权衡。实际应用中,不同场景选择不同策略:金融系统重一致(CP),社交应用重可用(AP),内网系统可选CA。现代架构更趋向动态调整与混合策略,灵活应对复杂需求。
|
1月前
|
数据采集 机器学习/深度学习 运维
量化合约系统开发架构入门
量化合约系统核心在于数据、策略、风控与执行四大模块的协同,构建从数据到决策再到执行的闭环工作流。强调可追溯、可复现与可观测性,避免常见误区如重回测轻验证、忽视数据质量或滞后风控。初学者应以MVP为起点,结合回测框架与实时风控实践,逐步迭代。详见相关入门与实战资料。
|
1月前
|
存储 运维 分布式计算
零售数据湖的进化之路:滔搏从Lambda架构到阿里云Flink+Paimon统一架构的实战实践
在数字化浪潮席卷全球的今天,传统零售企业面临着前所未有的技术挑战和转型压力。本文整理自 Flink Forward Asia 2025 城市巡回上海站,滔搏技术负责人分享了滔搏从传统 Lambda 架构向阿里云实时计算 Flink 版+Paimon 统一架构转型的完整实战历程。这不仅是一次技术架构的重大升级,更是中国零售企业拥抱实时数据湖仓一体化的典型案例。
158 0
|
2月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
2月前
|
数据采集 存储 运维
MyEMS:技术架构深度剖析与用户实践支持体系
MyEMS 是一款开源能源管理系统,采用分层架构设计,涵盖数据采集、传输、处理与应用全流程,支持多协议设备接入与多样化能源场景。系统具备高扩展性与易用性,结合完善的文档、社区、培训与定制服务,助力不同技术背景用户高效实现能源数字化管理,降低使用门槛与运维成本,广泛适用于工业、商业及公共机构等场景。
132 0
|
1月前
|
存储 SQL 消息中间件
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践
查询性能实现从秒级到毫秒级的跨越式提升
|
1月前
|
缓存 Cloud Native 中间件
《聊聊分布式》从单体到分布式:电商系统架构演进之路
本文系统阐述了电商平台从单体到分布式架构的演进历程,剖析了单体架构的局限性与分布式架构的优势,结合淘宝、京东等真实案例,深入探讨了服务拆分、数据库分片、中间件体系等关键技术实践,并总结了渐进式迁移策略与核心经验,为大型应用架构升级提供了全面参考。
|
1月前
|
存储 NoSQL 前端开发
【赵渝强老师】MongoDB的分布式存储架构
MongoDB分片通过将数据分布到多台服务器,实现海量数据的高效存储与读写。其架构包含路由、配置服务器和分片服务器,支持水平扩展,结合复制集保障高可用性,适用于大规模生产环境。
266 1

热门文章

最新文章