当leetcode真题上了生产引发的线上问题
11月7日上午,支付网关下游HSF请求出现失败,一台额度中心服务器异常。经排查,发现是B算法在处理47笔订单时导致内存溢出(OOM)。该算法用于计算用户可用额度下的最优订单组合,但因递归创建链表占用过多内存而崩溃。为解决此问题,团队紧急将用户流量切换至A算法,并对B算法进行优化。通过分治+回溯和背包算法的对比实验,最终选择根据订单数和金额阈值动态选择算法,确保系统稳定性和性能。此次事件提醒我们,在编程中需充分考虑边界情况并进行性能测试,避免极端情况对系统的影响。
低并发编程|如何用720个请求让后端服务器瘫痪
本次故障因应用启动时未有效校验核心依赖模块初始化异常,导致后续请求处理中抛出无法捕获的错误,引发线程阻塞,最终耗尽HSF线程池,服务不可用。排查发现类初始化失败且异常未被正确处理,结合线程无限等待问题,确认为依赖初始化异常与流处理中断所致。修复措施包括加强启动校验、捕获Throwable及设置合理超时。总结指出,系统稳定性需从细节入手,防微杜渐,避免连锁故障。
玩转Edas应用部署
EDAS 提供了一个可视化的应用发布与管理平台;EDAS 提供了一个高性能的 RPC 框架,能够构建高可用的分布式系统;EDAS提供一系列系统数据化运营组件,本文正是针对EDAS的应用部署的分享。请保持认真的姿势把文章看到底!
高德服务单元化方案和架构实践
本文主要介绍了高德在服务单元化建设方面的一些实践经验,服务单元化建设面临很多共性问题,如请求路由、单元封闭、数据同步,有的有成熟方案可以借鉴和使用,但不同公司的业务不尽相同,要尽可能的结合业务特点,做相应的设计和处理。