使用阿里云发布分布式网站,开发时候应该注意什么?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
对象存储 OSS,20GB 3个月
传统型负载均衡 CLB,每月750个小时 15LCU
简介: 1,数据库单独运行 这个最简单,相信只要用到了数据库的网站,大部分都是已经可以轻松实现网站和数据库分离的模式。之所以强调这点,就是因为,网站真的到了访问量大了,需要由单机发布改为分布式发布时候。首先就是要把数据库单独出来,使用单独一台ECS或者使用专门的RDS运行。

虽然之前写过关于负载均衡的文章,但是似乎大家都对负载均衡这个标题很陌生。今天就换个角度,从分布式网站发布角度说一下


首先,网站发布一定离不开服务器,就是阿里云的云服务器ECS。最近发现,老用户也有机会购买特价服务器,参考阿里云天猫旗舰店。分布式网站架构,在开发环节需要处理号几个地方,才能更轻松的扩展:

  • 1,数据库单独运行

这个最简单,相信只要用到了数据库的网站,大部分都是已经可以轻松实现网站和数据库分离的模式。之所以强调这点,就是因为,网站真的到了访问量大了,需要由单机发布改为分布式发布时候。首先就是要把数据库单独出来,使用单独一台ECS或者使用专门的RDS运行。

关于使用ECS自行搭建数据库,要说的无非就是,数据库文件一定要放在SSD硬盘上。因为云硬盘本质都是虚拟硬盘,读写指标iops会损失的很严重。当然业务量大了之后,我更建议选购RDS,RDS阿里云专门的数据库服务产品,mysql,sqlserver等多款分支,说实话,用惯了ECS自建可能会感觉这个产品挺贵的。但是实际上RDS已经针对硬盘读写,高可用,轻松拓展读写分离等提供了巨大的便利。因此大部分分布式网站都是选用了RDS等产品。

  • 2,session存储

大部分网站都是有登录需求或者其他session存储需求的。其实真正服务某一个用户的服务器只有一个,然而分布式网站是在负载均衡的规则下转发到后台服务器,如果负载均衡没有开启回话保持功能,那么很有可能用户登录后,其他访问很有可能到达不同的后端服务器处理,而实现不同服务器同样能支持服务的办法就是,session得共享起来。这样就做到了让用户不需要反复登录。

session共享有多重方法,一种是什么都不用做,session存储在收到请求的那台ECS本地,这种情况就需要负载均衡开启“会话保持”功能。这么做可以实现大部分分布式发布需求,但是如果有使用session统计在线量的时候就会发现只统计到某台ECS登录的用户量。

还有一种session共享的办法是使用单独的服务存储session,例如专门拿出来一台ECS做session服务。这里也有人跟倾向于单独用一个redis服务共享存储session,也是非常好的办法。

  • 3,用户上传的文件

很多网站存在用户上传的情况,但是分布式发布后,显然用户上传的时候传入了服务器A,等以后下载的时候使用的是服务器B,这时候如果没做共享,显然用户下载的文件会报错404,因为服务器B路径下显然没有用户传到A服务器里的文件。

解决办法很简单,就是讲所有的上传文件,传入到服务器之后,都转存到“共享文件服务器”,这个共享文件服务器,可以考虑自己搭建,但我建议的是使用阿里云提供的“对象存储OSS”服务。这样用户所有的下载,都走的时候OSS的访问地址,就不会报错404了。而且OSS是个独立的服务,下载文件使用的是OSS的流量,不占用发布网站的ECS的带宽。这就可以做到1M服务器带宽撑起峰值几十人甚至上百人的并发的原因。如果文件较多,另外建议将OSS搭配CDN使用

  • 4,网站的日志文件

很多网站开发时候都是留有日志功能的,这些日志,就不再适合继续使用网站目录下某个路径存储了。原因跟上一条一样:文件存储在单台服务器里,要拿到全部日志文件需要每台服务器去获取一遍,显然不合适!

解决办法跟上一条很相似:使用共享文件服务器存储日志。这里需要注意避免日志文件重名,常见的年月日明明,在这里就会冲突,因为多台服务器都会产生相同文件名称的日志。但是我在这里,更建议大家把需要收集的日志文件,直接放入数据库RDS中。这样获取日志就不用每台服务器去汇总了。直接从数据库查出来就好。

  • 5,发布网站文件一致

发布文件一致,就是为了保证更好的扩展。将来服务器压力太大,只需要直接从现有服务器环境拷贝一份即可。甚至搭配阿里云的“弹性伸缩ESS服务”。可以根据设置好的伸缩规则,自动按照某个服务器模板增加或者减少WEB服务器数量,实现弹性扩容。


综上所述,一个功能较全的分布式网站发布在阿里云,公共需要这么几个服务:ECS多台,SLB一台,RDS一台,Redis或有,ESS或有。

通过ECS+SLB+RDS+Redis+ESS的搭配,就可以轻松应对更多的访问量了。


附录:阿里云相关产品的帮助文档:

《云服务器ECS帮助文档》

《负载均衡SLB帮助文档》

《对象存储OSS帮助文档》

《弹性伸缩ESS帮助文档》

《CDN帮助文档》

原文地址: https://www.opengps.cn/Blog/View.aspx?id=238 文章的更新编辑依此链接为准。欢迎关注源站原创文章!
相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
opengps
+关注
目录
打赏
0
0
0
0
1
分享
相关文章
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
智慧工地源码,Java语言开发,微服务架构,支持分布式和集群部署,多端覆盖
智慧工地是“互联网+建筑工地”的创新模式,基于物联网、移动互联网、BIM、大数据、人工智能等技术,实现对施工现场人员、设备、材料、安全等环节的智能化管理。其解决方案涵盖数据大屏、移动APP和PC管理端,采用高性能Java微服务架构,支持分布式与集群部署,结合Redis、消息队列等技术确保系统稳定高效。通过大数据驱动决策、物联网实时监测预警及AI智能视频监控,消除数据孤岛,提升项目可控性与安全性。智慧工地提供专家级远程管理服务,助力施工质量和安全管理升级,同时依托可扩展平台、多端应用和丰富设备接口,满足多样化需求,推动建筑行业数字化转型。
119 5
HarmonyOS NEXT~HarmonyOS 语言仓颉:下一代分布式开发语言的技术解析与应用实践
HarmonyOS语言仓颉是华为专为HarmonyOS生态系统设计的新型编程语言,旨在解决分布式环境下的开发挑战。它以“编码创造”为理念,具备分布式原生、高性能与高效率、安全可靠三大核心特性。仓颉语言通过内置分布式能力简化跨设备开发,提供统一的编程模型和开发体验。文章从语言基础、关键特性、开发实践及未来展望四个方面剖析其技术优势,助力开发者掌握这一新兴工具,构建全场景分布式应用。
313 35
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
142 0
分布式开发:数字时代的高性能架构革命-为什么要用分布式?优雅草卓伊凡
鸿蒙HarmonyOS应用开发 | 探索 HarmonyOS Next-从开发到实战掌握 HarmonyOS Next 的分布式能力
HarmonyOS Next 是华为新一代操作系统,专注于分布式技术的深度应用与生态融合。本文通过技术特点、应用场景及实战案例,全面解析其核心技术架构与开发流程。重点介绍分布式软总线2.0、数据管理、任务调度等升级特性,并提供基于 ArkTS 的原生开发支持。通过开发跨设备协同音乐播放应用,展示分布式能力的实际应用,涵盖项目配置、主界面设计、分布式服务实现及部署调试步骤。此外,深入分析分布式数据同步原理、任务调度优化及常见问题解决方案,帮助开发者掌握 HarmonyOS Next 的核心技术和实战技巧。
784 76
鸿蒙HarmonyOS应用开发 | 探索 HarmonyOS Next-从开发到实战掌握 HarmonyOS Next 的分布式能力
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
101 0
DeepSeek进阶开发与应用4:DeepSeek中的分布式训练技术
随着深度学习模型和数据集规模的扩大,单机训练已无法满足需求,分布式训练技术应运而生。DeepSeek框架支持数据并行和模型并行两种模式,通过将计算任务分配到多个节点上并行执行,显著提高训练效率。本文介绍DeepSeek中的分布式训练技术,包括配置与启动方法,帮助用户轻松实现大规模模型训练。数据并行通过`MirroredStrategy`同步梯度,适用于大多数模型;模型并行则通过`ParameterServerStrategy`异步处理大模型。DeepSeek简化了分布式环境配置,支持单机多卡和多机多卡等场景。
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
150 6
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
260 2

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等