官方博客-第16页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

996

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

996

闵子

2023-12-01

2887

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,887

杨永

2024-05-15

93880

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,880

ModelScope

2024-05-15

110015

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,015

ModelScope

2024-05-15

1214

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,214

坤硕

2024-07-29

20105

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,105

耘越

2024-10-29

1455

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,455

信徒

2024-12-05

837

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

837

阿里云云原生

2025-01-06

1848

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

想象一下，只需简单几步操作，就能生成逼真的语音效果，无论是为客户服务还是为游戏角色配音，都能轻松实现。GPT-Sovits 模型，其高效的语音生成能力为实现自然、流畅的语音交互提供了强有力的技术支持。本文将详细介绍如何利用函数计算平台部署 GPT-Sovits 模型，以构建一个高效、可扩展的 AI 语音交互系统。通过这一部署方案，开发者和企业能够快速集成语音合成功能，实现从文本到语音的无缝转换，进而推动智能语音应用的创新和发展。

阿里云云原生

1,848

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

从浏览器原理出发聊聊Chrome插件

使用KMS为MSE-Nacos敏感配置加密的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

元象大模型开源30款量化版本加速低成本部署丨附教程

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

AI 辅助编程的效果衡量

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

从浏览器原理出发聊聊Chrome插件

使用KMS为MSE-Nacos敏感配置加密的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

AI 辅助编程的效果衡量

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

元象大模型开源30款量化版本加速低成本部署丨附教程