官方博客-第5页-阿里云开发者社区

米基

2024-05-15

3705

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,705

山泽

2024-05-15

1269

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,269

宗衡

2025-07-10

650

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

650

灵杰开发者

2025-08-08

557

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

557

壬云

2025-05-29

1217

本文介绍了一种基于阿里云计算巢的一站式MCP工具解决方案，解决了传统MCP工具集成中的效率低下、调用方式割裂和动态管理困难等问题。方案通过标准化协议实现多MCP工具批量部署，提高云资源利用率，并支持OpenAPI与MCP双通道调用，使主流AI助手如Dify、Cherry Studio等无缝接入。内容涵盖背景、原理剖析、部署使用实战及问题排查，最后强调MCP协议作为“通用语言”连接数字与物理世界的重要性。

壬云

1,217

ModelScope

2024-05-15

15068

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,068

ModelScope

2025-06-16

486

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

486

孙玉梅

2025-04-01

316

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

316

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43654

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,654

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

从零构建现代深度学习框架(TinyDL-0.01)

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

MCP进阶：一键批量搞定MCP工具部署

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

从零构建现代深度学习框架(TinyDL-0.01)

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

MCP进阶：一键批量搞定MCP工具部署

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统