一次架构失误的反思

简介: 我们公司的系统要做改造,以前是1台服务器,现在要换成4台服务器,我去的时候,运维已经把架构方案那些,都弄好了,都已经在测试了,大概架构如下: 请注意,这个和我们传统的架构是有区别的,nginx 和php-fpm分别是单独的二台服务器,php-fpm只做php解析工作,所有到nginx 的php...

我们公司的系统要做改造,以前是1台服务器,现在要换成4台服务器,我去的时候,运维已经把架构方案那些,都弄好了,都已经在测试了,大概架构如下:

请注意,这个和我们传统的架构是有区别的,nginx 和php-fpm分别是单独的二台服务器,php-fpm只做php解析工作,所有到nginx 的php请求,都会发给php-fpm,说实话我还是第一次,看到这种架构,节约资源,必竟少一个nginx嘛,一般都是nginx+php-fpm是在一台服务器上面的

运维当时的想法是所有的静态资源请求都到nginx服务器上面,实现分布式,图片上传又要用阿里云nfs,前期没有那么大的量,就暂时用这个,结果数据转移过去,下 午的时候,io读写频繁,根本没有那么大的访问量,服务器负载超高,用户无法访问,后面经过反复的思考,确定是nfs 的问题,然后,就改了架构,换成传统的nginx+fpm,先去掉nfs ,当然 也不是nfs的问题,当时为了解决前端的nginx访问时出了问题,才把php和用户上传的图片一起挂在了一起,先解决问题,去掉了nfs

转移图片过程出又遇到了图片资源太大,目录不够的问题,我以为运维挂的是/data目录,结果居然挂的是/data/public 目录,最近访问量太大,日志文件一下爆涨,当时设置的不是一人很大的目录,监控工具又没有上到,结果突然用户访问时报了一个错,去服务器看了看,发现磁盘满了,清了服务器的日志,然后又好了.

总结:

  1.用户磁盘,io,cpu,内存那些,还是要上专门的监控工具

  2.项目架构一定要用传统的,

  3.对于要增长的数据,比如用户的访问日志一定要放到大磁上去,当然现在elk工具还是很流行,主要是还没有来得及上

 

目录
相关文章
|
8月前
|
芯片
2023年的技术总结和工作反思
一、回顾2023年 回顾自己的2023年,还是发生了很多的变化。在大学毕业,就来到了芯翼参加工作,在这里也遇到了很多的前辈和小伙伴,收获工作的同时也收获了友情。但是,随着公司发展战略的变化,公司的人员架构也变额很多,对于我们刚毕业的大学生也变得越来越不友好,其实我也清楚这就是社会的发展现状。 其实,这不是我最终产生离职想法的结果,最终让我决定离职的是公司新来的人事主管十分的不理解我们,总是处处针对我们,这对于专心搞技术研发的我们来说,无疑是一个定时炸弹,让我们觉得自己的工作没有意义,甚至是没有成绩和结果,总是挂在嘴边的KPI考核也是越来越严格,总是觉得刚毕业的大学生的能力不行之类的,话说谁
|
4月前
|
项目管理
技术探索的心得与反思
在技术的海洋中,每一次深入都如同揭开未知领域的神秘面纱。本文将分享一些个人在技术领域探索中的感悟和反思。
|
5月前
|
测试技术 UED
软件测试中的心理学:提升效率与质量的非技术因素
【8月更文挑战第9天】 在追求代码质量和系统稳定性的技术赛道上,软件测试常被视为一项严格的技术活动。然而,隐藏在测试用例、自动化脚本和缺陷报告背后的是一群具有丰富情感和心理活动的测试工程师。本文将探讨影响软件测试效果的心理学因素,揭示非技术要素如何显著提升测试流程的效率和最终产品的质量。通过理解测试人员的心理动机、压力应对机制以及团队动力学,我们可以为测试团队打造一个更加健康、高效的工作环境,并激发他们的潜力。
|
5月前
|
测试技术
软件测试中的心理学:如何优化测试流程
【8月更文挑战第6天】本文深入探讨了软件测试过程中的心理学因素,揭示了测试人员的心理动态对测试效率和质量的影响。通过分析测试人员的压力源、动机以及团队间的沟通问题,提出了一系列改善策略,如建立积极的反馈机制、提供持续的职业培训和优化工作环境等,旨在提升软件测试的整体效能。文章最后提出一个开放性问题,邀请读者思考如何在不断变化的技术环境中维持测试团队的心理健康和动力。
|
5月前
|
机器学习/深度学习 人工智能 运维
运维自动化之路:提升效率与减少失误
【8月更文挑战第15天】在数字化时代,运维工作变得日益复杂和繁重。传统的手动操作方式已难以满足现代企业的需求,自动化运维因此成为提升工作效率、降低错误率的关键。本文将深入探讨自动化运维的重要性,分析实现自动化运维的步骤,以及如何克服实施过程中的挑战,旨在为读者提供一条清晰的自动化运维发展路径。
|
5月前
|
运维 监控 安全
运维之道:从混乱到秩序的旅程
【8月更文挑战第15天】在数字化时代的浪潮中,企业运维管理的重要性日益凸显。本文将探讨如何通过有效的策略和实践,将运维工作从一片混沌转变为有序可控的状态。我们将深入分析现代运维面临的挑战,并提出一系列解决方案,旨在帮助运维团队提高工作效率,确保系统的稳定性和安全性。
40 0
|
运维 监控 Cloud Native
运维自动化:提高效率的秘诀
运维自动化:提高效率的秘诀
195 0
|
8月前
|
SQL 缓存 开发工具
CodeReview对于一个企业的重要性
odeReview 是开发过程不可或缺的重要一环,如果将代码发布比作一个工厂的流水线,那么 CodeReview 就是流水线接近于终点的质检员,他要担负着对产品质量的保障工作,将“缺陷”从众多的“产品”中挑出,反向推动“生产方”改进生产质量。
94 1
|
监控 测试技术 程序员
|
机器学习/深度学习 安全 测试技术
我亲身经历的2022年软件质量工作
我亲身经历的2022年软件质量工作

相关课程

更多