官方博客-第7页-阿里云开发者社区

扬流

2024-05-15

119121

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,121

米基

2024-05-15

3817

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,817

硅步

2024-09-27

840

灵魂拷问-前端的作用--性能优化篇

作者最近在尝试对负责的平台进行性能优化，本文整理了些前端性能优化的一些常见策略。

硅步

840

白玙

2025-03-14

1773

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

1,773

ant-ray项目组

2025-04-11

1179

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,179

骆天

2024-05-15

3722

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,722

望宸彦林

2024-06-24

53221

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

53,221

砚染

2024-09-03

1576

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,576

阿里云云原生

2025-04-23

959

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

959

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

Paimon 与 Spark 的集成（二）：查询优化

大模型推理优化实践：KV cache复用与投机采样

灵魂拷问-前端的作用--性能优化篇

详解大模型应用可观测全链路

AI开源框架：让分布式系统调试不再"黑盒"

高并发架构设计三大利器：缓存、限流和降级

从云原生视角看 AI 原生应用架构的实践

速成RAG+Agent框架大模型应用搭建

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Paimon 与 Spark 的集成（二）：查询优化

大模型推理优化实践：KV cache复用与投机采样

灵魂拷问-前端的作用--性能优化篇

详解大模型应用可观测全链路

AI开源框架：让分布式系统调试不再"黑盒"

高并发架构设计三大利器：缓存、限流和降级

从云原生视角看 AI 原生应用架构的实践

速成RAG+Agent框架大模型应用搭建

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览