官方博客-第7页-阿里云开发者社区

米基

2024-05-15

3741

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,741

阿里云云原生

2025-07-21

720

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

本课程通过通义灵码实现零代码数据分析全流程，涵盖数据读取、清洗、可视化、报告生成及内容仿写，无需编程基础，轻松掌握从CSV导入到PDF报告输出的实战技能。

阿里云云原生

720

阿里云云原生

2025-04-25

1662

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

本文深入解析了Model Context Protocol（MCP）协议，探讨其在AI领域的应用与技术挑战。MCP作为AI协作的“USB-C接口”，通过标准化数据交互解决大模型潜力释放的关键瓶颈。文章详细分析了MCP的生命周期、传输方式（STDIO与SSE），并提出针对SSE协议不足的优化方案——MCP Proxy，实现从STDIO到SSE的无缝转换。同时，函数计算平台被推荐为MCP Server的理想运行时，因其具备自动弹性扩缩容、高安全性和按需计费等优势。最后，展望了MCP技术演进方向及对AI基础设施普及的推动作用，强调函数计算助力MCP大规模落地，加速行业创新。

阿里云云原生

1,662

星舰正泽

2024-05-15

68041

通义千问API：让大模型写代码和跑代码

基于前面三章的铺垫，本章我们将展示大模型Agent的强大能力。我们不仅要实现让大模型同时使用多种查询工具，还要实现让大模型能查询天气情况，最后让大模型自己写代码来查询天气情况。

星舰正泽

68,041

阿里云实时数仓Hologres

2024-06-07

130268

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

130,268

灵杰开发者

2025-07-18

881

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

淘天集团数据开发团队基于Fluss构建新一代实时数仓，解决数据消费冗余、探查困难及大State运维难题。Fluss融合列存与实时更新能力，支持列裁剪、KV点查、Delta Join及湖流一体，显著降低IO与计算资源消耗，提升作业稳定性与数据探查效率。已在淘天AB实验平台落地，覆盖搜索、推荐等核心业务，通过618大促验证，实现千万级流量、秒级延迟，资源消耗降低30%，State缩减超100TB。未来将持续深化湖仓架构，拓展AI场景应用。

灵杰开发者

881

耘越

2024-10-29

1421

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,421

探索云世界

2025-08-05

774

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

774

元丹

2024-05-15

282686

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

282,686

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

通义千问API：让大模型写代码和跑代码

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

AI 辅助编程的效果衡量

Qwen-MT：翻得快，译得巧

深入浅出LangChain与智能Agent：构建下一代AI助手

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

通义千问API：让大模型写代码和跑代码

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

AI 辅助编程的效果衡量

Qwen-MT：翻得快，译得巧

深入浅出LangChain与智能Agent：构建下一代AI助手