备案控制台登录注册

开发者社区人工智能文章正文

阿里P9架构师终于把毕生心血而成的分布式高可用算法笔记开源了

2023-10-12 445 发布于北京

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 说在前面的话分布式系统无处不在。一台计算机内部多个互联的处理器组成了一个分布式系统，它们通过“一致性缓存”算法使每个处理器核心看到相同的数据。近三十年来，随着互联网的发展，越来越多的互联网后台系统采用计算机集群的方式来应对海量请求和数据的需求，这个计算机集群也是分布式系统。为了简化分布式系统的开发，出现了很多为开发者提供分布式框架的开源项目，例如Apache基金会旗下的ZooKeeper项目就是一个应用广泛的分布式框架。同时，国内也有很多关于如何使用这些分布式框架来搭建应用的书籍，它们极大地推动了分布式系统在国内的应用。我们不仅要知道如何使用这些现成的分布式框架来搭建应用，而且应

说在前面的话

分布式系统无处不在。

一台计算机内部多个互联的处理器组成了一个分布式系统，它们通过“一致性缓存”算法使每个处理器核心看到相同的数据。近三十年来，随着互联网的发展，越来越多的互联网后台系统采用计算机集群的方式来应对海量请求和数据的需求，这个计算机集群也是分布式系统。

为了简化分布式系统的开发，出现了很多为开发者提供分布式框架的开源项目，例如Apache基金会旗下的ZooKeeper项目就是一个应用广泛的分布式框架。

同时，国内也有很多关于如何使用这些分布式框架来搭建应用的书籍，它们极大地推动了分布式系统在国内的应用。我们不仅要知道如何使用这些现成的分布式框架来搭建应用，而且应该知道这些分布式框架背后的设计原理，做到“知其然，亦知其所以然”。

主要内容

本文尝试以通俗易懂的方式从理论的角度系统性地介绍分布式系统和算法，使读者不仅从算法层面知道诸如共享内存、共识、信号量等分布式抽象背后的工作原理，还知道分布式系统是如何被建模的，进而知道这些算法是怎么来的、为什么是对的、适用场景是什么，为将来自行设计分布式算法打下基础。

本文总共分为10章的内容，因为包含的内容比较多，这里只做了简单的介绍，每章里面包含很多小点，小点里面也有更加细化的内容。

1初识分布式，介绍什么是分布式系统，分布式算法的用处，以及设计分布式算法面临的主要挑战，让读者对本文所介绍的分布式系统和算法的范围有初步认识

2算法模型，通过本章的学习，读者将意识到设计分布式算法就是在定义自动机与外界的交互行为，并且能够阅读分布式算法。

3系统模型，通过本章的学习，读者将掌握设计一个分布式系统主要的关注点。

4链路，通过本章的学习，读者不仅会更熟悉编程模型，而且将更深入地理解自动机和它的生命周期。

5.失败检测和选主，通过本章的学习，读者将知道如何进行失败检测和选主，什么系统能够进行失败检测和选主，什么系统无法进行失败检测和选主。

6可靠广播，从基础的尽力广播开始，依次介绍正则可靠广播、统一可靠广播、顽固广播、概率广播、先进先出广播和因果可靠广播。

7共享内存，

8.共识，共识是分布式系统得以实现高可用和一致性的关键技术。

9.介绍基于共识的应用，包括全序广播、复制状态机、信号量、原子提交（事务）、组成员关系等。最后还会介绍复制状态机的重配技术，实现进程动态地加入和离开系统。在ZooKeeper、etcd等开源分布式框架中的Reconfiguration功能的背后，其实就是复制状态机的重配技术。

10.基于时钟的算法，本章介绍如何利用时钟同步系统构造网络同步系统，以及如何利用网络同步系统构造时钟同步系统，从而证明了时钟同步与网络同步的等价性。基于这一等价性，读者可以利用现代计算机的本地时钟、时钟同步协议以及原子钟等技术弥补网络的不足，即使在网络异步的情况下，也可以实现同步系统。

由于包含的内容实在是太多了，这里就不给大家做过多的介绍了，需要完整版分布式高可用算法笔记的小伙伴点击此处即可

本文总结

本文从底层的I/O自动机模型开始，逐一深入，直到揭开共识的面纱，让读者能够系统地从底层原理了解分布式系统和算法在设计过程中的取舍与平衡。

同时，本文尽量避免使用过于复杂的数学记号，而是用自然语言的方式证明每个算法的正确性，相信用心的专业读者都能看懂。既把底层原理说清楚，又没有高深的数学符号，是本文的一大特色。

文章标签：

算法

架构师

Apache

缓存

开发者

关键词：

分布式算法

架构分布式

架构算法

分布式架构师

算法分布式

游客io6musbi47krs

+关注

目录

打赏

0

0

0

0

62

相关文章

小华同学ai

|

7天前

|

安全 NoSQL MongoDB

XJ-Survey：这个让滴滴日均处理1.2亿次问卷请求的开源系统，今天终于公开了它的架构密码！

嗨，大家好，我是小华同学。今天为大家介绍一款由滴滴开源的高效调研系统——XJ-Survey。它功能强大，支持多类型数据采集、智能逻辑编排、精细权限管理和数据在线分析，适用于问卷、考试、测评等场景。采用 Vue3、NestJS 等先进技术栈，确保高性能与安全性。无论是企业还是个人，XJ-Survey 都是你不可错过的神器！项目地址：[https://github.com/didi/xiaoju-survey](https://github.com/didi/xiaoju-survey)

小华同学ai

51 15 15

德哥

|

12天前

|

存储关系型数据库分布式数据库

PolarDB 开源基础教程系列 1 架构解读

PolarDB 是阿里云研发的云原生分布式数据库，基于 PostgreSQL 开源版本，旨在解决传统数据库在大规模数据和高并发场景下的性能和扩展性问题。其主要特点包括： 1. **存储计算分离架构**：通过将计算与存储分离，实现极致弹性、共享一份数据以降低成本、透明读写分离。 2. **HTAP 架构**：支持混合事务处理和分析处理（HTAP），能够在同一系统中高效执行 OLTP 和 OLAP 查询。 3. **优化的日志复制机制**：采用只复制元数据的方式减少网络传输量，优化页面回放和 DDL 锁回放过程。 4. **并行查询与索引创建**：引入 MPP 分布式执行引擎。

德哥

41 7 7

追逐时光者

|

1月前

|

开发框架前端开发 .NET

一个适用于 .NET 的开源整洁架构项目模板

一个适用于 .NET 的开源整洁架构项目模板

追逐时光者

60 26 27

蚝油菜花

|

2月前

|

人工智能自然语言处理

RWKV-7：RWKV系列开源最新的大模型架构，具有强大的上下文学习能力，超越传统的Attention范式

RWKV-7是RWKV系列的最新大模型架构版本，具有强大的上下文学习能力，超越了传统的attention和linear attention范式。本文详细介绍了RWKV-7的主要功能、技术原理及其在多语言处理、文本生成等领域的应用场景。

蚝油菜花

189 7 7

RWKV-7：RWKV系列开源最新的大模型架构，具有强大的上下文学习能力，超越传统的Attention范式

全干程序员demo

|

3月前

|

存储 SQL Apache

Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库

Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库，以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景，适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃，已广泛应用于电商、广告、用户行为分析等领域。

全干程序员demo

210 1 1

Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库

楠竹11

|

3月前

|

编解码人工智能开发者

长短大小样样精通！原始分辨率、超长视频输入：更灵活的全开源多模态架构Oryx

【10月更文挑战第23天】Oryx 是一种新型多模态架构，能够灵活处理各种分辨率的图像和视频数据。其核心创新在于能够对图像和视频进行任意分辨率编码，并通过动态压缩器模块提高处理效率。Oryx 在处理长视觉上下文（如视频）时表现出色，同时在图像、视频和3D多模态理解方面也展现了强大能力。该模型的开源性质为多模态研究社区提供了宝贵资源，但同时也面临一些挑战，如选择合适的分辨率和压缩率以及计算资源的需求。

楠竹11

56 3 3

技术自由圈/原疯狂创客圈

|

4月前

|

消息中间件架构师 Java

阿里面试：秒杀的分布式事务，是如何设计的？

在40岁老架构师尼恩的读者交流群中，近期有小伙伴在面试阿里、滴滴、极兔等一线互联网企业时，遇到了许多关于分布式事务的重要面试题。为了帮助大家更好地应对这些面试题，尼恩进行了系统化的梳理，详细介绍了Seata和RocketMQ事务消息的结合，以及如何实现强弱结合型事务。文章还提供了分布式事务的标准面试答案，并推荐了《尼恩Java面试宝典PDF》等资源，帮助大家在面试中脱颖而出。

技术自由圈/原疯狂创客圈

143 1 1

zzy的aly

|

4月前

|

算法 API 计算机视觉

人脸识别笔记(一)：通过yuface调包(参数量54K更快更小更准的算法) 来实现人脸识别

本文介绍了YuNet系列人脸检测算法的优化和使用，包括YuNet-s和YuNet-n，以及通过yuface库和onnx在不同场景下实现人脸检测的方法。

zzy的aly

150 1 1

zzy的aly

|

4月前

|

JSON 算法数据可视化

测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算（目标检测）

这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析（包括TP、FP、FN、TN、精准率和召回率），接口处理，数据集处理，以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例，用于处理图像文件、转换数据格式以及计算目标检测的性能指标。

zzy的aly

112 0 0

测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算（目标检测）

zzy的aly

|

4月前

|

数据可视化搜索推荐 Python

Leecode 刷题笔记之可视化六大排序算法：冒泡、快速、归并、插入、选择、桶排序

这篇文章是关于LeetCode刷题笔记，主要介绍了六大排序算法（冒泡、快速、归并、插入、选择、桶排序）的Python实现及其可视化过程。

zzy的aly

43 0 0

热门文章

最新文章

图解前向、反向传播算法，一看就懂！

利用SVM(支持向量机)分类算法对鸢尾花数据集进行分类

近端策略优化(PPO)算法的理论基础与PyTorch代码详解

基于FPGA的图像双线性插值算法verilog实现,包括tb测试文件和MATLAB辅助验证

接入DeepSeek需要做算法备案吗？一文读懂算法备案的那些事儿

C 408—《数据结构》算法题基础篇—链表（下）

【算法合规新时代】企业如何把握“清朗·网络平台算法典型问题治理”专项行动？

C 408—《数据结构》算法题基础篇—链表（上）

单纯接入第三方模型就无需算法备案了么？

不属于五种算法是否无需备案？一文读懂算法备案的真相

分布式篇问题之集群（Cluster）模式主控节点的高可用性问题如何解决

现代数据库技术中的分布式一致性问题与解决方案探讨

高并发架构设计三大利器：缓存、限流和降级问题之缓存的应对策略问题如何解决

高并发架构设计三大利器：缓存、限流和降级问题之Redis用于搭建分布式缓存集群问题如何解决

分布式锁实现原理问题之使用Redis的setNx命令来实现分布式锁问题如何解决

Java Redis并发读写锁，使用Redisson实现分布式锁

利用Python实现Redis的分布式锁

深入理解分布式缓存在后端系统中的应用与实践

深入理解分布式缓存在现代后端系统中的应用与挑战

共识协议的技术变迁问题之状态机的命令序列实现如何解决

相关课程

更多

Spring Boot+Vue.js+FastDFS实现分布式图片服务器

基于Zookeeper、Dubbo构建互联网分布式基础架构

Go语言核心编程 - 数据结构和算法

分布式文件存储系统技术及实现

分布式协调系统 Zookeeper 快速入门

神经网络概览及算法详解

相关电子书

更多

高并发分布式缓存Redis6.0

基于社区的分布式风险感知模型

如何利用Redisson分布式化传统Web项目

相关实验场景

更多

基于百炼构建可以划重点、规划学习计划的学习助手

体验PolarDB-X透明分布式

每个IT人都想学的“Web应用上云经典架构”实战

MySQL引擎及架构优化

倚天大数据电商数据分析快速实践

使用Swing算法实现商品推荐

下一篇

阿里云oss简介和如何对接使用

目录

目录

你好，我是AI助理

可以解答问题、推荐解决方案等