官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3790

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,790

唐殊

2024-11-01

1909

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

1,909

探索云世界

2025-08-05

817

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

817

灵杰开发者

2025-08-08

624

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

624

孙玉梅

2025-04-01

378

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

378

子潍

2025-05-22

1317

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,317

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43725

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,725

望宸

2025-02-28

1086

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,086

DataWorks团队

2025-04-17

760

智能体Agent：用自然语言重构数据开发

本文分享如何基于利用MCP协议，配置MCP Server，以调用大数据开发与治理平台DataWorks Open API搭建智能体Agent，实现通过自然语言完成数据集成与数据开发等任务。文章还介绍了MCP协议的基本知识，帮助大家了解背后实现原理。大家可以通过自行配置体验数据工作流智能自动化运行。

DataWorks团队

760

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

Qwen-MT：翻得快，译得巧

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大模型推理主战场：通信协议的标配

智能体Agent：用自然语言重构数据开发

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

Qwen-MT：翻得快，译得巧

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大模型推理主战场：通信协议的标配

智能体Agent：用自然语言重构数据开发