官方博客-第14页-阿里云开发者社区

隆基

2024-05-15

142696

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,696

ModelScope

2024-05-15

1138

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,138

米基

2024-05-15

3641

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,641

亦达

2025-02-20

648

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

648

阿里云云原生

2025-05-12

908

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

908

宗衡

2025-07-10

565

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

565

灵杰开发者

2025-08-08

458

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

458

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43568

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,568

扬流

2024-05-15

118998

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,998

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

元象大模型开源30款量化版本加速低成本部署丨附教程

大模型推理优化实践：KV cache复用与投机采样

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何在通义灵码里使用 MCP 能力

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

Paimon 与 Spark 的集成（二）：查询优化

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

元象大模型开源30款量化版本 加速低成本部署丨附教程

大模型推理优化实践：KV cache复用与投机采样

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何在通义灵码里使用 MCP 能力

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

Paimon 与 Spark 的集成（二）：查询优化

元象大模型开源30款量化版本加速低成本部署丨附教程