一些问题
从整个网站奔溃开始分析原因:
- 开发对比上次上线和本次上线的代码区别和功能区别
- ddb观察数据库的性能状况
- 测试和开发回顾操作流程
ddb发现数据库连接资源耗尽,并截取一些慢查询数据给开发。开发根据sql找到相关代码并查出sql操作的数据的数量级,发现有一个sql在当时搜索还不完善的时候在做获取全表数据的操作,此表数据恰恰又是1一千多万级别的,导致预发测试时耗尽数据库资源。注:预发和线上共用线上数据库。经测试再次尝试确定是此问题,解决方案此类推荐业务先block,后期设计开发,其他先线上。
从3.8发200礼物到发出了2000的问题分析:
代码用了static,服务是分布式分布,每台200,10台就是2000。公司诚信亏损背锅。
微服务健康度模型
微服务可靠性设计模型
机器学习