Kubernetes

首页 标签 Kubernetes
# Kubernetes #
关注
19251内容
|
24天前
| |
来自: 云原生
从 Docker 到 ACK:Kubernetes 企业级实践、避坑指南与成本优化全景解析
本文深度解析Kubernetes企业级落地实践,涵盖ACK托管服务优势、生产环境十大典型坑点(如资源不限、数据库容器化等)、核心对象最佳配置(资源限制、健康检查、HPA等),并提供GPU推理部署与成本优化实战方案,助力企业构建稳定、高效、低成本云原生平台。
|
24天前
| |
来自: 云原生
【重磅】 Blade AI 自主韧性测试智能体正式开源
本次阿里云峰会上发布韧性测试智能体 Blade AI:用自然语言一句话自动完成系统韧性测试全流程。
服务器突然连不上了,要从哪里开始查?
运维最怕的不是宕机,而是“突然连不上”:SSH超时、业务异常却难定位。本文详解五步排查法——从网络连通性、监控分析、控制台登录、防火墙到容器网络,并强调监控与巡检对早发现、快响应的关键价值。
程序员进阶工程师必备技能之工程化与研发效率建设(四)
教程来源 https://bgnno.cn/ 该CI/CD流水线基于GitHub Actions构建:CI阶段涵盖代码规范检查(Black/Isort/Ruff/Mypy)、单元与集成测试(含PostgreSQL/Redis服务)、Docker镜像构建及Trivy安全扫描;CD阶段支持语义化版本触发部署,采用Kubernetes蓝绿发布策略,含人工审批、健康验证与自动回滚,兼顾安全性与可靠性。
|
24天前
| |
来自: 云原生
阿里云云原生DevOps:基于ACK构建企业级CI/CD流水线
企业上云后,如何高效地进行应用交付成为核心挑战。本文分享基于阿里云容器服务ACK和云效DevOps平台构建企业级CI/CD流水线的完整实践,涵盖镜像构建、自动部署、灰度发布、安全扫描和成本优化5个核心环节。以一个日活百万的在线教育平台为例,将发布频率从每周1次提升到每天10次,部署成功率从85%提升到99.5%,年节省服务器成本约48万元。
Kubernetes告警风暴是怎么形成的
K8s告警风暴:一个节点故障触发数十条重复告警,CPU/内存阈值误报频发,事件刷屏掩盖真问题。根源在于层级依赖放大、指标失真与缺乏根因分析。治理关键:智能聚合、动态阈值、自动归因——让告警少而准。
|
24天前
| |
来自: 云原生
[yahoon 原创] Helm Chart的离线安装
## Helm Chart的离线安装(tar.gz文件) 最近在学习helm, 作为运维,以前对这个K8s的应用部署接触的不多, 这几天正好实践操作一下。
私域直播系统开发从0开始:完整搭建流程解析
本文系统讲解私域直播平台从0到1的完整开发:涵盖架构设计(多端+直播/业务/基础设施三层)、推流播放、实时互动、商品订单、支付回放、中控后台及高并发优化(Redis/Kafka/K8s),助力企业构建自主可控的直播商业生态。(239字)
|
24天前
| |
来自: 云原生
阿里云正式发布 RCA Benchmark,业界首个面向 Agentic Ops 的根因分析开源基准体系
阿里云联合信通院、中科院软件所/计算机网络信息中心、清华大学、复旦大学、南开大学,正式开源首个面向 Agentic Ops 根因分析评估基准RCA Benchmark。通过构建数据集、评估协议与仿真环境,帮助衡量 AI Agent 故障诊断能力,为行业落地夯实底座。
|
24天前
|
不上公有云FaaS,也不搭建K8s:FinSafe 如何让企业在内网里安全运行AI Agent
金融、政府、医疗等高合规行业引入 AI Agent 时,真正难点不只是模型能力,而是代码执行和工具调用如何在内网安全运行。 分享一下FinSafe如何在现有Linux服务器上,为Agent提供轻量隔离、资源约束、访问控制和审计追踪能力,让企业不必依赖公有云FaaS,也不必一开始搭建完整 K8s 集群,就能实现AI可控~
免费试用