官方博客-第6页-阿里云开发者社区

米基

2024-05-15

3798

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,798

灵杰开发者

2025-08-08

632

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

632

星舰正泽

2024-05-15

243067

通义千问API：用4行代码对话大模型

本章将通过一个简单的例子，让你快速进入到通义千问大模型应用开发的世界。

星舰正泽

243,067

希秀吴诗倩柳佚洲公等

2024-09-03

3400

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

3,400

砚染

2024-09-03

1558

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,558

阿里云存储

2024-05-15

140401

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

140,401

羿莉

2025-01-14

685

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

685

丕天

2025-03-21

1145

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,145

子潍

2025-05-22

1326

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,326

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

通义千问API：用4行代码对话大模型

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

速成RAG+Agent框架大模型应用搭建

用软硬协同设计下的飞天盘古降低存储系统开销

网络安全视角：从地域到账号的阿里云日志审计实践

AI 推理场景的痛点和解决方案

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

通义千问API：用4行代码对话大模型

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

速成RAG+Agent框架大模型应用搭建

用软硬协同设计下的飞天盘古降低存储系统开销

网络安全视角：从地域到账号的阿里云日志审计实践

AI 推理场景的痛点和解决方案

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能