官方博客-第13页-阿里云开发者社区

阿里云云原生

2025-06-30

538

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

538

ModelScope

2024-05-15

910

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

910

ModelScope

2024-05-15

2046

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

2,046

澄潭计缘望宸

2025-03-14

1174

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,174

宗衡

2025-07-10

957

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

957

阿里云云原生

2025-08-01

1158

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,158

ModelScope

2024-05-15

1557

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,557

ModelScope

2024-05-15

110147

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,147

阿里云云原生

2024-12-04

789

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

789

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序