官方博客-第16页-阿里云开发者社区

望宸

2025-02-20

663

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

663

澄潭计缘望宸

2025-03-14

992

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

992

濯光翼严

2025-04-15

562

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

562

ModelScope

2025-06-16

546

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

546

焱冰

2023-03-09

11755

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

焱冰

11,755

ModelScope

2024-05-15

1211

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,211

阿里云大数据Al技术

2024-05-15

145485

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,485

阿里云存储

2024-10-15

1283

AI时代数据湖实践

本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖，通过高吞吐训练和高效推理帮助企业快速实现数据价值，以及用户在使用中的最佳实践。

阿里云存储

1,283

耘越

2024-10-29

1452

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,452

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

数据湖存储的安全写入之道

元象大模型开源30款量化版本加速低成本部署丨附教程

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

AI时代数据湖实践

AI 辅助编程的效果衡量

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

数据湖存储的安全写入之道

元象大模型开源30款量化版本 加速低成本部署丨附教程

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

AI时代数据湖实践

AI 辅助编程的效果衡量

元象大模型开源30款量化版本加速低成本部署丨附教程