「分布式理论 - 现代架构基石」

简介: 「分布式理论 - 现代架构基石」

分布式概述:

什么是分布式?

分布式系统是计算机程序的集合,这些程序利用跨多个独立计算节
点的计算资源来实现共同的目标。可以分为分布式计算、分布式存储、分布式数据库等。

优势:

1.去中心化
2.低成本
3.弹性
4.资源共享
5.可靠性高

挑战:

1.普遍的节点故障
2.不可靠的网络
3.异构的机器与硬件环境
4.安全
AI 代码解读

常见的分布式系统

1.Google File System(GFS):google分布式文件系统:
分布式存储
2.Ceph:统一的分布式存储系统
3.Hadoop HDFS:基于GFS架构的开源分布式文件系统

4.Zookeeper:高可用的分布式数据管理与系统协调框架
分布式数据库
1.Google Spanner:googlei可扩展的、全球分布式的数据库
2.TDB:开源分布式关系型数据库
3.HBase:开源Nosql数据库
4.MongoDB:文档数据库

分布式计算:
1.Hadoop:基于MapReduce分布式计算框架
2.Spark:在Hadoop:基础之上,使用内存来存储数据
3.YARN:分布式资源调度
AI 代码解读

故障模型

·Byzantine failure:节点可以任意篡改发送给其他节点的数据

·Authentication detectable byzantine failure (ADB):
Byzantine failuref的特例;节点可以篡改数据,但不能
伪造其他节点的数据

·Performance failure:节点未在特定时间段内收到数
据,即时间太早或太晚

·Omission failure:节点收到数据的时间无限晚,即收
不到数据

·Crash failure:在omission failure的基础上,增加了
节点停止响应的假设,也即持续性地omission failure

·Fail-stop failure:在Crash failurel的基础上增加了错
误可检测的假设
AI 代码解读

cap理论

C (Consistence):
一致性,指数据在多个副本之间能够保持一致的特性(严格的一致性)

A (Availability):
可用性,指系统提供的服务必须一直处于可用的状态,每次请求都能获取到非错的响应一但是不
保证获取的数据为最新数据。

P (Network partitioning:
分区容错性,分布式系统在遇到任何网络分区故障的时候,仍然能够对外提供满足一致性和可用性
的服务,除非整个网络环境都发生了故障。
AI 代码解读

CA:放弃分区容错性,加强一致性和可用性,其实就是传统的单机数据库的选
择

AP:放弃一致性(这里说的一致性是强一致性),追求分区容错性和可用性,
例如一些注重用户体验的系统

CP:放弃可用性,追求一致性和分区容错性,例如与钱财安全相关的系统
AI 代码解读

acid理论:

事务是数据库系统中非常重要的概念,它是数据库管理系统执行过程中的一个逻辑单元,它能够保证一个事务中的所有操作要
么全部执行,要么全都不执行。
数据库事务拥有四个特性ACID,即分别是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(
Durability)
原子性(A):原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚。

一致性(C):一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态

隔离性(I):隔离性是当多个用户并发访问数据库时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个并发事务之间要相互隔离

持久性(D):持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到做障的情积下地不△手失提衣事多的提作
AI 代码解读
目录
打赏
0
0
0
0
2
分享
相关文章
智慧工地源码,Java语言开发,微服务架构,支持分布式和集群部署,多端覆盖
智慧工地是“互联网+建筑工地”的创新模式,基于物联网、移动互联网、BIM、大数据、人工智能等技术,实现对施工现场人员、设备、材料、安全等环节的智能化管理。其解决方案涵盖数据大屏、移动APP和PC管理端,采用高性能Java微服务架构,支持分布式与集群部署,结合Redis、消息队列等技术确保系统稳定高效。通过大数据驱动决策、物联网实时监测预警及AI智能视频监控,消除数据孤岛,提升项目可控性与安全性。智慧工地提供专家级远程管理服务,助力施工质量和安全管理升级,同时依托可扩展平台、多端应用和丰富设备接口,满足多样化需求,推动建筑行业数字化转型。
47 5
分布式系统架构8:分布式缓存
本文介绍了分布式缓存的理论知识及Redis集群的应用,探讨了AP与CP的区别,Redis作为AP系统具备高性能和高可用性但不保证强一致性。文章还讲解了透明多级缓存(TMC)的概念及其优缺点,并详细分析了memcached和Redis的分布式实现方案。此外,针对缓存穿透、击穿、雪崩和污染等常见问题提供了应对策略,强调了Cache Aside模式在解决数据一致性方面的作用。最后指出,面试中关于缓存的问题多围绕Redis展开,建议深入学习相关知识点。
325 8
文生图架构设计原来如此简单之分布式服务
想象一下,当成千上万的用户同时要求AI画图,如何公平高效地处理这些请求?文生图/图生图大模型的架构设计看似复杂,实则遵循简单而有效的原则:合理排队、分工明确、防患未然。
91 14
文生图架构设计原来如此简单之分布式服务
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
90 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
DeepSeekMoE是一种创新的大规模语言模型架构,融合了专家混合系统(MoE)、多头潜在注意力机制(MLA)和RMSNorm归一化。通过专家共享、动态路由和潜在变量缓存技术,DeepSeekMoE在保持性能的同时,将计算开销降低了40%,显著提升了训练和推理效率。该模型在语言建模、机器翻译和长文本处理等任务中表现出色,具备广泛的应用前景,特别是在计算资源受限的场景下。
663 29
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。
深度剖析数据中台架构图,铸造数字文明的基石
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
分布式系统架构6:链路追踪
本文深入探讨了分布式系统中的链路追踪理论,涵盖追踪与跨度的概念、追踪系统的模块划分及数据收集的三种方式。链路追踪旨在解决复杂分布式系统中请求流转路径不清晰的问题,帮助快速定位故障和性能瓶颈。文中介绍了基于日志、服务探针和边车代理的数据收集方法,并简述了OpenTracing、OpenCensus和OpenTelemetry等链路追踪协议的发展历程及其特点。通过理解这些概念,可以更好地掌握开源链路追踪框架的使用。
160 41
分布式系统架构7:本地缓存
这是小卷关于分布式系统架构学习的第10篇文章,主要介绍本地缓存的基础理论。文章分析了引入缓存的利弊,解释了缓存对CPU和I/O压力的缓解作用,并讨论了缓存的吞吐量、命中率、淘汰策略等属性。同时,对比了几种常见的本地缓存工具(如ConcurrentHashMap、Ehcache、Guava Cache和Caffeine),详细介绍了它们的访问控制、淘汰策略及扩展功能。
110 6
[PolarDB实操课] 01.PolarDB分布式版架构介绍
《PolarDB实操课》之“PolarDB分布式版架构介绍”由阿里云架构师王江颖主讲。课程涵盖PolarDB-X的分布式架构、典型业务场景(如实时交易、海量数据存储等)、分布式焦点问题(如业务连续性、一致性保障等)及技术架构详解。PolarDB-X基于Share-Nothing架构,支持HTAP能力,具备高可用性和容错性,适用于多种分布式改造和迁移场景。课程链接:[https://developer.aliyun.com/live/253957](https://developer.aliyun.com/live/253957)。更多内容可访问阿里云培训中心。
[PolarDB实操课] 01.PolarDB分布式版架构介绍