官方博客-第17页-阿里云开发者社区

望雲十雨言澈

2025-04-10

544

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

544

阿里云云原生

2025-04-28

961

通义灵码Project Rules是一种针对AI代码生成的个性化规则设定工具，旨在解决AI生成代码不精准或不符合开发者需求的问题。通过定义编码规则（如遵循SOLID原则、OWASP安全规范等），用户可引导模型生成更符合项目风格和偏好的代码。例如，在使用阿里云百炼服务平台的curl调用时，通义灵码可根据预设规则生成Java代码，显著提升代码采纳率至95%以上。此外，还支持技术栈、应用逻辑设计、核心代码规范等多方面规则定制，优化生成代码的质量与安全性。

阿里云云原生

961

豁朗

2022-05-16

2219

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,219

杨永

2024-05-15

93862

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,862

ModelScope

2024-05-15

109995

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,995

张昕东

2024-07-25

14040

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,040

阿里云云原生

2024-12-17

839

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

839

澄潭计缘望宸

2025-03-14

976

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

976

阿里云开发者

2025-04-24

1141

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,141

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

对比测评：AI编程工具需要 Rules 能力

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

使用KMS为MSE-Nacos敏感配置加密的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

10 分钟打造你的专属 AI 客服

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

为什么一定要做Agent智能体？

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

对比测评：AI编程工具需要 Rules 能力

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

使用KMS为MSE-Nacos敏感配置加密的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

10 分钟打造你的专属 AI 客服

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

为什么一定要做Agent智能体？