当leetcode真题上了生产引发的线上问题
11月7日上午,支付网关下游HSF请求出现失败,一台额度中心服务器异常。经排查,发现是B算法在处理47笔订单时导致内存溢出(OOM)。该算法用于计算用户可用额度下的最优订单组合,但因递归创建链表占用过多内存而崩溃。为解决此问题,团队紧急将用户流量切换至A算法,并对B算法进行优化。通过分治+回溯和背包算法的对比实验,最终选择根据订单数和金额阈值动态选择算法,确保系统稳定性和性能。此次事件提醒我们,在编程中需充分考虑边界情况并进行性能测试,避免极端情况对系统的影响。
HSF HSFServiceAddressNotFoundException案列分析
项目组在阿里专有云V3.12上运行,使用EDAS taobao-tomcat Pandora容器及HSF作为RPC框架。在HSF Consumer尝试调用Provider时出现`HSFServiceAddressNotFoundException`异常,提示找不到目标服务地址。经检查,HSF服务配置正确,但通过Pandora QOS进一步诊断发现Provider状态为invalid。此状态通常意味着Consumer无法访问到Provider,通过telnet验证了这一情况。问题根源在于Consumer和Provider间的HSF端口不匹配导致网络不通。