运维

首页 标签 运维
# 运维 #
关注
37917内容
2025年高并发系统全链路压测平台对比与瓶颈定位最佳实践
文章聚焦2025年高并发系统全链路压测,介绍主流方案分SaaS化与私有化两类,对比两者优劣。阐述瓶颈定位靠分布式追踪等技术,分享电商、金融场景实践案例。还解答方案选择、核心差异、瓶颈定位关键及避免影响生产环境等问题,提供全链路压测全面指导。
阿里云函数计算入门:5 分钟部署你的第一个 Serverless 应用
本文介绍如何在5分钟内使用阿里云函数计算(FC)部署首个Serverless应用。通过创建服务、配置HTTP触发器、编写Node.js代码并测试,即可快速上线一个可公网访问的HTTP接口,无需管理服务器,轻松实现轻量开发与扩展。
阿里云 Tair 基于 3FS 工程化落地 KVCache:企业级部署、高可用运维与性能调优实践
阿里云 Tair KVCache 团队联合硬件团队对 3FS 进行深度优化,通过 RDMA 流量均衡、小 I/O 调优及全用户态落盘引擎,提升 4K 随机读 IOPS 150%;增强 GDR 零拷贝、多租户隔离与云原生运维能力,构建高性能、高可用、易管理的 KVCache 存储底座,助力 AI 大模型推理降本增效。
|
8天前
|
赛题解读Introduction | 土木工程赛道Civil Engineering Track
首届国际工程智能大赛启动!聚焦土木工程赛道,挑战桥梁关键构件智能网格生成。融合AI与结构力学,推动BIM与有限元分析高效协同,提升计算精度与效率,助力“交通强国”与新基建发展。
一场FullGC故障排查
本文记录了一次由Full GC引发的CPU使用率异常问题排查过程。通过分析JVM堆内存发现,大对象(List<Map>)导致老年代频繁占满,触发Full GC,进而引起CPU飙升。结合JPofiler工具定位到代码中Excel数据加载逻辑存在内存膨胀问题,最终提出优化方案并总结排查思路。
XXLJOB:超长定时任务慢节点优化实践
本文针对ODPS大宽表任务耗时严重问题,通过定位卡点、资源调优与数据倾斜处理实现快速止血,并深入梳理代码结构,发现计算堆积、动态倾斜及回刷成本高等问题。最终提出视图落表、前置裁剪、分布式MapJoin优化及节点拆分等方案,将产出时间从13:00提前至8:30,提升效率4小时以上,显著降低资源消耗与维护成本。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户实时掌握SQL使用情况,识别异常、优化性能,提升日志数据分析效率与治理水平。
如何基于关键词进行拆分?
基于关键词拆分可减少搜索请求复制,提升效率。将词典分片存储于不同服务器,查询时按关键词定位分片,避免全量请求。但存在管理复杂、高频词性能差、负载不均等问题,多用于高性能场景,通用系统仍倾向文档级拆分以保障可维护性与扩展性。
|
8天前
| |
来自: 弹性计算
别再拍脑袋上线了:聊聊“发布前自动打分系统”,用数据提前识别变更风险
别再拍脑袋上线了:聊聊“发布前自动打分系统”,用数据提前识别变更风险
免费试用