官方博客-第16页-阿里云开发者社区

李德

2024-12-06

1478

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,478

望宸

2025-02-28

1291

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,291

丕天

2025-03-21

1301

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,301

阿里云云原生

2025-08-01

1153

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,153

探索云世界

2025-11-17

251

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

251

ModelScope

2024-05-15

1997

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,997

ModelScope

2024-05-15

898

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

898

赵世振

2024-12-24

2720

【最佳实践系列】高并发调用百炼语音合成大模型

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,720

澄潭计缘望宸

2025-03-14

1168

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,168

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

【最佳实践系列】高并发调用百炼语音合成大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

【最佳实践系列】高并发调用百炼语音合成大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要