官方博客-第7页-阿里云开发者社区

米基

2024-05-15

3798

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,798

思勉宙游

2024-05-24

62623

ClickHouse物化视图里常见的7个坑，点进看避坑指南

一文解析ClickHouse物化视图

思勉宙游

62,623

灵杰开发者

2025-08-08

632

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

632

阿里云网络

2024-05-15

129384

重磅解读阿里云云网络领域关键技术创新

2023年10月31日，杭州·云栖大会，阿里云技术主论坛带来了一场关于阿里云主力产品与技术创新的深度解读，阿里云网络产品线负责人祝顺民带来《云智创新，网络随行》的主题发言，针对阿里云飞天洛神云网络（下文简称洛神网络）领域产品服务创新以及背后的技术积累进行了深度解读，不少背后的创新技术系首次重磅披露。

阿里云网络

129,384

星舰正泽

2024-05-15

243067

通义千问API：用4行代码对话大模型

本章将通过一个简单的例子，让你快速进入到通义千问大模型应用开发的世界。

星舰正泽

243,067

希秀吴诗倩柳佚洲公等

2024-09-03

3400

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

3,400

砚染

2024-09-03

1558

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,558

清都

2023-10-12

131663

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践，给大家快速落地AIGC应用提供参考。

清都

131,663

丕天

2025-03-21

1145

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,145

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

ClickHouse物化视图里常见的7个坑，点进看避坑指南

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

重磅解读阿里云云网络领域关键技术创新

通义千问API：用4行代码对话大模型

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

速成RAG+Agent框架大模型应用搭建

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

AI 推理场景的痛点和解决方案

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

ClickHouse物化视图里常见的7个坑，点进看避坑指南

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

重磅解读阿里云云网络领域关键技术创新

通义千问API：用4行代码对话大模型

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

速成RAG+Agent框架大模型应用搭建

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

AI 推理场景的痛点和解决方案