运维

首页 标签 运维
# 运维 #
关注
37861内容
|
5小时前
| |
来自: 弹性计算
别再用人拍脑袋调度了:用强化学习“驯服”Kubernetes 批处理与副本策略
别再用人拍脑袋调度了:用强化学习“驯服”Kubernetes 批处理与副本策略
|
7小时前
|
主流AI证书深度对比:从入门到进阶,怎么选不踩坑?
随着人工智能技术持续渗透各行各业,“懂AI”已从职业加分项变成不少岗位的基础要求。智联招聘数据显示,72%的AI相关岗位在招聘时会将“持有权威认证”作为筛选硬标准,持证者薪资溢价普遍达20%-35%。但市面上的AI证书五花八门,有国际大厂推出的技术认证,有国内厂商的生态绑定证书,还有适配零基础学习者的通用证书,到底哪款适合自己?本文就为你全面拆解主流AI证书的核心差异,帮你理清选择思路。
|
9小时前
|
【服务器数据恢复】RAID阵列SSD固态硬盘故障导致互联网企业用户数据丢失数据恢复案例
深圳市某互联网科技公司,专注于生活服务类APP开发,平台注册用户超5000万,日均活跃用户800万,核心业务涵盖外卖配送、本地生活服务预订等。公司数据中心部署了30台浪潮NF5280M6服务器,采用“SSD+机械硬盘”混合存储架构,其中10台服务器配置4块2TB NVMe SSD组建RAID10阵列,专门存储用户基础信息、订单记录及支付数据,数据总量约15TB,直接关系到平台的正常运营及用户体验。
|
1天前
|
阿里云服务器ECS和其他云服务器对比,有哪些特点和优势?
阿里云ECS实例规格丰富,支持多种计算架构,覆盖全场景应用。具备弹性伸缩、分钟级扩容、高可用性与99.995% SLA保障,提供多重安全防护及灵活计费方式,助力企业降本增效,是稳定可靠、简单易用的首选云服务器。
Redis:内存陡增100%深度复盘
一次Redis崩溃事故复盘:因大KEY导致带宽占满,触发缓冲区激增,内存被耗尽。虽有淘汰策略,但仅作用于数据内存,缓冲区内存无限制,最终引发全面超时。根源在于网络与存储资源设计失衡,暴露了缓冲区管理盲区。
XXLJOB:超长定时任务慢节点优化实践
针对ODPS大宽表任务耗时问题,通过定位慢节点、资源调优与数据倾斜处理实现快速止血;进一步梳理代码链路,提出视图落表、前置裁剪、中表关联等优化方案,拆分节点并降低回刷成本。最终产出时间从13:00提早至8:30,提升效率4小时以上,显著降低计算堆积与资源消耗。
一场FullGC故障排查
因JVM Full GC导致CPU使用率飙升至104%,排查发现是用户上传的Excel数据以List<Map>形式加载至内存,造成堆内存膨胀。通过JPofiler分析堆快照,定位到大对象为多个大型Map,因HashMap存储效率低,17MB文件占用达128MB内存。任务运行期间该对象长期驻留内存,引发频繁Full GC。解决方案:一是将数据移出JVM内存,存入Redis缓存(治本);二是优化内存使用,删除冗余字段减少对象大小(治标)。排查中需区分机器监控与JVM监控,避免误判。
补丁别靠吼,Linux补丁要自动化!从 openEuler 打通到全栈实践方案
补丁别靠吼,Linux补丁要自动化!从 openEuler 打通到全栈实践方案
|
1天前
| |
来自: 弹性计算
别让 AIOps 变成“闭眼修系统”——说说可解释 AIOps 如何防止二次事故
别让 AIOps 变成“闭眼修系统”——说说可解释 AIOps 如何防止二次事故
|
1天前
|
阿里云函数计算FC免费试用:每月免费15万CU,试用额度可抵扣函数调用次数、活跃vCPU等费用
阿里云函数计算FC提供每月15万CU免费额度,有效期3个月,支持事件驱动、免运维的Serverless服务,适用于AI、Web、视频转码等场景,新用户可申请,涵盖vCPU、内存、GPU、磁盘及公网流量,按需计费。
免费试用