官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

110146

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,146

龙蜥社区OpenAnolis

2024-11-06

888

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

888

望宸

2025-02-28

1294

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,294

澄潭计缘望宸

2025-03-14

1169

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,169

丕天

2025-03-21

1301

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,301

宗衡

2025-07-10

954

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

954

阿里云大数据Al技术

2024-05-15

145646

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,646

虎仔

2024-10-22

1389

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,389

耘越

2024-10-29

1625

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,625

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

大模型推理主战场：通信协议的标配

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 推理场景的痛点和解决方案

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

最佳实践：通义灵码生成单元测试，让单测更简单

AI 辅助编程的效果衡量

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

大模型推理主战场：通信协议的标配

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 推理场景的痛点和解决方案

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

最佳实践：通义灵码生成单元测试，让单测更简单

AI 辅助编程的效果衡量