SAN Architectural Brief

简介:

今天与以前一位做存储的同事(现在支付宝)还有BROCADE上海那边的工程师聊了一些SAN的话题,在这里记录一下,顺便写一下我理解的SAN的设计概要,希望对大家有点帮助。

对于一个企业来说,数据是相当重要的(垃圾数据就不说了)。比如银行的个人账户信息,超时的销售记录等等。

在数据的生命周期中存在多种多样的特征(动态的和静态的)。如数据的存在形态,数据量,粒度,增长速度,使用频率等等

根据不同的场景,设计合理的存储架构即可以满足企业的当下需求,又要兼顾未来企业的发展,减少碳排放,注意投资保护等等。

设计合理的存储架构需要对当下企业存储情况进行调研,充分了解业务的发展和当下的需求。评估未来几年的存储需求(包括IO,吞吐量,容量等等),对于一个已有业务,可以取出历史数据进行趋势分析,推测未来几年的趋势。

扯了这么多,开始进入主题,今天的主题是SAN的架构设计,先来了解几个术语。

DAS(Direct-Attached Storage)  :

也称为非网络共享存储,从字面上很好理解,这应该是比较早的共享存储的技术。典型的是SAS,ULTRA SCSI接口连接的存储等等。优点是比较便宜,缺点是天花板太低了,或者说可扩容的余地较小,投资回报也是比较小的,因为利用率较为低下。

NAS(Network-attached Storage)

或称为网络共享存储,如SMB,NFS,MFS,AFS等等。构建一个NAS需要一台提供共享服务的服务器,客户机需要支持共享服务的客户端。优点是共享方便,廉价等。确定是高度依赖网络,性能可能不稳定,普通的LAN中延时较大(INFINIBAND可能会较好,不过造价昂贵)。

SAN(Storage Area Network)

存储区域网络,也可以理解为存储专用网络。构建一个基本的SAN环境需要光纤交换机,连接设备,支持SAN的存储,服务器等。SAN的优点是传输速度快,扩容上限大大提高,扩容方便,投资保护大。缺点是造价较为昂贵,多了一个布线的环节(随着FCOE的发展,布线可能会简单很多)。

DAS,NAS,SAN三者的区别:

DAS的存储和服务器之间没有其他的中间层。NAS和SAN的存储和服务器之间都存在中间层(网络,交换机或提供共享服务的服务器)。

对于NAS和SAN,用一个图来加深一下认识:

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

 

接下来细说一下SAN:

首先,在SAN中存在两种最基本的角色,INITIOR(ACTIVE),TARGET(PASSIVE)。initior就是发起请求的那一方(如HBA),TARGET是接受请求的那一方(如存储的FC口)。而FC SWITCH是将这两方串起来的设备(ZONE),同样FCSW还承担了管理和监控的角色。根据INITIOR的特性,FCSW的另一个功能是屏蔽两个INITIOR之间的交换。

被串起来的两个设备就像建立了一个独有的通道一样,被称为fibre channel,fibre channel 是一个二层的协议,正因为如此SAN的扩展也是有上限的,比以太网小得多。每一个FABRIC中的所有交换设备必须有相同的ZONE数据信息,换句话说,在一个FABRIC中的任意一个设备都必须知道initior和target的访问控制信息,这有点类似于mac地址信息表但是又不一样,因为FABRIC网络是单向的,而LAN是双向的。

下面来看几个常见的SAN架构图,并解释一下各个架构的优缺点:

flat san top:

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

 

这个图上架设的是一个没有使用ISL(INTER-SWITCH Links)的单层SAN网络,呈现的特征是服务器和存储的交换不需要跨两个交换机,因为交换机之间的交换又增加了传输的延时,降低了IO响应速度。

冗余的话通过架设两个交换机来实现。使用FLAT架构的好处是服务器到存储的访问速度是最快的,也符合ras,(reliability,availability,serviceability)

如果要扩展FLAT架构的FABRIC网络,但是又不想使用ISL连接的话,需要增加交换机。如下:

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

 

从FLAT的架构上我们很容易看出,FLAT架构很快就会到达天花板,随着交换机的增加,存储的端口数将很快成为FLAT的瓶颈。如果使用SWITCH级联的方式,ISL的传输延时也将成为性能的瓶颈,通过与BROCADE原厂工程师了解,一般最多不要超过7个交换机进行级联,否则延时将成为严重瓶颈。

在FLAT中还要注意避免OVER-SUBSCRIPTion,也就是服务器和存储的比例,一般1GB链路是7:1,2GB链路是12:1,4GB链路是18:1。超过这个比例可能会产生性能问题,当然这不是必然,还是要根据服务器的IOPS需求来定义的。

mesh san top:

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

 

MESH架构的SAN环境,所有的FCSW之间都是互通的,服务器访问存储可能会跨越多个FCSW,造成通信延时。同时由于每个交换机都需要互联,将消耗大量的端口来进行ISL通信,在扩容上也是很麻烦的。这中设计一般是不推荐的。

core-edge top:

 

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

因为我们前面讲到FALT模式下,整张网很容易达到端口上限。于是出现了CORE-EDGE架构,它实际上是整合了多个FLAT FABRIC,使得各个FABRIC之间的存储可被共享。在CORE-EDGE的设计中,我们还是要尽量避免ISL通信,如将访问量最高的存储放在同一个FABRIC,而将访问量较小的并且需要多个FABRIC服务器共享的方在CORE层。

下面是一个三层结构的CORE-EDGE设计模型

SAN Architectural Brief - 德哥(DiGoal,Just Do It!) - Not Only DBA

 

 

其实总结起来将,就是考虑成本,考虑未来的发展趋势,按需要设计。

先写到这里

相关实践学习
函数计算部署PuLID for FLUX人像写真实现智能换颜效果
只需一张图片,生成程序员专属写真!本次实验在函数计算中内置PuLID for FLUX,您可以通过函数计算+Serverless应用中心一键部署Flux模型,快速体验超写实图像生成的魅力。
目录
相关文章
|
9天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
10天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
771 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
10天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
801 7
|
10天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
10天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2110 4
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
10天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
769 150
|
10天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1818 6
|
10天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
619 2