官方博客-第31页-阿里云开发者社区

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

621

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

621

阿里云云原生

2025-01-22

516

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

516

牧原

2025-02-21

597

K8S异常诊断之俺的内存呢

本文讲述作者如何解决客户集群中出现的OOM（Out of Memory）和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征，还深入探讨了排查过程中的关键步骤和技术细节。

牧原

597

是溪诚全南也

2025-02-28

932

1分钟集成DeepSeek满血版！搭建智能运维助手

阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务，本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型，如何搭建 Elasticsearch AI Assistant。

是溪诚全南也等

932

阿里云云原生

2025-04-28

705

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

705

达领

2023-04-23

25772

慢SQL是如何拖垮数据库的

本文结合一个实际故障案例出发，分析慢SQL是如何打垮数据库并引发故障的。

达领

25,772

阿里云AnalyticDB

2023-05-29

5731

AnalyticDB(ADB)+LLM，构建AIGC时代下企业专属Chatbot

如何基于向量数据库+LLM（大语言模型），打造更懂你的企业专属Chatbot。

阿里云AnalyticDB

5,731

阿里云PolarDB

2023-08-09

51650

PolarDB-X 针对跑批场景的思考和实践

金融行业和运营商系统，业务除了在线联机查询外，同时有离线跑批处理，跑批场景比较注重吞吐量，同时基于数据库场景有一定的使用惯性，比如直连MySQL分库分表的存储节点做本地化跑批、以及基于Oracle/DB2等数据库做ETL的数据清洗跑批等。

阿里云PolarDB

51,650

德歌

2023-09-14

935

沉浸式学习PostgreSQL|PolarDB 13: 博客、网站按标签内容检索, 并按匹配度排序

本文主要教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核.

德歌

935

官方博客-第31页-阿里云开发者社区

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

两步构建 AI 总结助手，实现智能文档摘要

K8S异常诊断之俺的内存呢

1分钟集成DeepSeek满血版！搭建智能运维助手

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

慢SQL是如何拖垮数据库的

AnalyticDB(ADB)+LLM，构建AIGC时代下企业专属Chatbot

PolarDB-X 针对跑批场景的思考和实践

沉浸式学习PostgreSQL|PolarDB 13: 博客、网站按标签内容检索, 并按匹配度排序

官方博客-第31页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

两步构建 AI 总结助手，实现智能文档摘要

K8S异常诊断之俺的内存呢

1分钟集成DeepSeek满血版！搭建智能运维助手

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

慢SQL是如何拖垮数据库的

AnalyticDB(ADB)+LLM，构建AIGC时代下企业专属Chatbot

PolarDB-X 针对跑批场景的思考和实践

沉浸式学习PostgreSQL|PolarDB 13: 博客、网站按标签内容检索, 并按匹配度排序