官方博客-第29页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

965

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

965

濯光于怀

2025-04-07

358

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

358

阿里云云原生

2025-06-03

1038

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,038

屈岳

2023-12-01

62648

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,648

孟威

2024-05-15

105523

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,523

ModelScope

2024-05-15

3516

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,516

奶司

2024-05-15

1098

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,098

ModelScope

2024-05-15

1132

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,132

逸扬

2024-05-15

440

DCDN助力企业灰度上云产品实践

提起CDN，大家想到的字眼可能是缓存、转发、调度，用来提升终端用户体验、保护源站IP、降低源站流量风险，同时可以将源站的应用功能卸载到边缘，进一步释放边缘算力满足业务需求。DCDN脱胎于CDN，面向动态元素，通过智能路由、协议优化、压缩传输等手段，将转发场景的性能提到极限，广泛应用于电商、游戏、政企等行业。在互联网蓬勃发展，传统企业寻求数字化转型机会的今天，DCDN作为流量的入口，搭配灵活易扩展的“高级条件”及“EdgeScript”，可以通过流量转发这一技术手段，实现客户上云的“安全灰度”。

逸扬

440

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

实现企业级 MCP 服务统一管理和智能检索的实践

SLS支持高精度时间戳和全局排序

SLS 大模型可观测&安全推理审计标准解决方案

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

人人都是AI大师 - Prompt工程

vLLM部署Yuan2.0：高吞吐、更便捷

DCDN助力企业灰度上云产品实践

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

实现企业级 MCP 服务统一管理和智能检索的实践

SLS支持高精度时间戳和全局排序

SLS 大模型可观测&安全推理审计标准解决方案

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

人人都是AI大师 - Prompt工程

vLLM部署Yuan2.0：高吞吐、更便捷

DCDN助力企业灰度上云产品实践