官方博客-第20页-阿里云开发者社区

望宸

2025-02-20

679

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

679

阿里云开发者

2025-04-24

200

快速定位进程性能瓶颈

这篇文章详细介绍了进程热点追踪的概念、业务痛点、解决方案以及实际案例分析，旨在帮助开发者和运维人员快速定位和解决系统性能瓶颈问题。

阿里云开发者

200

阿里云云原生

2025-04-28

731

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

731

阿里云云原生

2025-04-29

700

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

700

阿里云云原生

2025-05-12

1040

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,040

张佐玮

2023-12-01

1569

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,569

田双坤禹杨杨孙健翔

2024-05-15

101810

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,810

ModelScope

2024-05-15

1238

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,238

ModelScope

2024-05-15

1154

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,154

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

快速定位进程性能瓶颈

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

如何在通义灵码里使用 MCP 能力

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

元象大模型开源30款量化版本加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

快速定位进程性能瓶颈

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

如何在通义灵码里使用 MCP 能力

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

元象大模型开源30款量化版本 加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

元象大模型开源30款量化版本加速低成本部署丨附教程