官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3843

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,843

阿里云实时数仓Hologres

2024-06-07

130376

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

130,376

悟鸣

2024-05-15

240081

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

240,081

孙玉梅

2025-04-01

419

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

419

山泽

2024-05-15

1353

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,353

砚染

2024-09-03

1600

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,600

赵世振

2024-12-24

1324

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,324

扬流

2024-05-15

119145

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,145

阿里云云原生

2025-04-22

1375

本文介绍如何使用Serverless Devs CLI工具从零开发并一键部署MCP Server到阿里云函数计算（FC）。首先通过初始化MCP Server项目，完成本地代码编写，利用Node.js实现一个简单的Hello World工具。接着对代码进行打包，并通过Serverless Devs工具将项目部署至云端。部署完成后，提供三种客户端接入方式：官方Client、其他本地Client及在FC上部署的Client。最后可通过内置大模型的inspector测试部署效果。Serverless Devs简化了开发流程，提升了MCP Server的构建效率。

阿里云云原生

1,375

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

一文掌握大模型提示词技巧：从战略到战术

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

从零构建现代深度学习框架(TinyDL-0.01)

速成RAG+Agent框架大模型应用搭建

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

Paimon 与 Spark 的集成（二）：查询优化

从零开始开发 MCP Server

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

一文掌握大模型提示词技巧：从战略到战术

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

从零构建现代深度学习框架(TinyDL-0.01)

速成RAG+Agent框架大模型应用搭建

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

Paimon 与 Spark 的集成（二）：查询优化

从零开始开发 MCP Server