官方博客-第11页-阿里云开发者社区

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

615

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

615

羿莉

2024-12-26

782

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

782

有松

2025-01-16

310

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

310

尹丰彬

2025-02-21

809

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法，通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发，确保业务连续性与平滑迁移

尹丰彬

809

阿里云基础设施.

2025-05-01

358

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

358

王夕宁

2023-02-28

16902

应用场景系列之（1）,流量管理下的熔断场景

本文主要介绍深入理解熔断器在不同场景下的行为。

王夕宁

16,902

云服务器ECS

2023-07-10

4533

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,533

匡大虎

2024-05-15

1553

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论，深度解析企业云原生 DevSecOps 体系构建。

匡大虎

1,553

孟威

2024-05-15

105517

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,517

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

网络安全视角：从地域到账号的阿里云日志审计实践

AI 场景下，函数计算 GPU 实例模型存储最佳实践

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

ACK AI Profiling：从黑箱到透明的问题剖析

应用场景系列之（1）,流量管理下的熔断场景

一键配置版：搭建高可用的微信/支付宝小程序服务

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

SLS 大模型可观测&安全推理审计标准解决方案

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

网络安全视角：从地域到账号的阿里云日志审计实践

AI 场景下，函数计算 GPU 实例模型存储最佳实践

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

ACK AI Profiling：从黑箱到透明的问题剖析

应用场景系列之（1）,流量管理下的熔断场景

一键配置版：搭建高可用的微信/支付宝小程序服务

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

SLS 大模型可观测&安全推理审计标准解决方案