官方博客-第13页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

1167

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,167

探索云世界

2025-11-17

181

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第七篇，基于MaxCompute 多租的大数据平台架构。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

181

李德

2024-12-06

1475

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,475

澄潭

2025-04-03

2016

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

2,016

阿里云云原生

2025-07-21

941

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

本课程通过通义灵码实现零代码数据分析全流程，涵盖数据读取、清洗、可视化、报告生成及内容仿写，无需编程基础，轻松掌握从CSV导入到PDF报告输出的实战技能。

阿里云云原生

941

岩叶

2024-05-15

860

企业用户认证及文件权限控制-手把手指南

本篇文章模拟一个企业级用户需求，手把手的描述企业级客户如何使用阿里云文件存储 NAS 实现云办公，实现多用户数据共享与隔离。

岩叶

860

垚佳汐遥

2024-10-23

1093

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,093

望宸

2025-02-28

1287

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,287

ModelScope

2024-05-15

1320

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,320

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

开源 Remote MCP Server 一站式托管来啦！

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

企业用户认证及文件权限控制-手把手指南

通义灵码知识库问答增强：知识库构建与管理指南

大模型推理主战场：通信协议的标配

快来与 CodeQwen1.5 结对编程

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

开源 Remote MCP Server 一站式托管来啦！

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

企业用户认证及文件权限控制-手把手指南

通义灵码知识库问答增强：知识库构建与管理指南

大模型推理主战场：通信协议的标配

快来与 CodeQwen1.5 结对编程