官方博客-第12页-阿里云开发者社区

ModelScope

2024-05-15

1321

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,321

阿里云云原生

2024-09-25

996

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

996

阿里云云原生

2025-01-26

1394

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,394

宗衡

2025-07-10

948

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

948

ModelScope

2024-05-15

903

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

903

阿里云云原生

2024-05-15

67438

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

67,438

一默

2024-08-26

407

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

407

阿里云云原生

2025-09-24

667

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

本文所阐述的配置驱动智能 Agent 架构，其核心价值在于为 Agent 开发领域提供了一套通用的、可落地的标准化范式。

阿里云云原生

667

ModelScope

2024-05-15

110143

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,143

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

新场景、新能力，AI-native 时代的可观测革新

最近谈论 SSE 和 WebSocket 的人越来越多的原因

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

打破传统叙事逻辑，构建基于原子化任务的人机交互

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

新场景、新能力，AI-native 时代的可观测革新

最近谈论 SSE 和 WebSocket 的人越来越多的原因

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

打破传统叙事逻辑，构建基于原子化任务的人机交互

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践