官方博客-第9页-阿里云开发者社区

米基

2024-05-15

3791

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,791

阿里云大数据Al技术

2025-07-18

827

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

827

唐殊

2024-11-01

1910

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

1,910

孙玉梅

2025-04-01

380

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

380

灵杰开发者

2025-08-08

625

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

625

大模型服务小助手

2025-07-01

1164

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

本文介绍如何利用智能体与Python代码批量处理Excel中的脏数据，解决人工录入导致的格式混乱、逻辑错误等问题。通过构建具备数据校验、异常标记及自动修正功能的系统，将数小时的人工核查任务缩短至分钟级，大幅提升数据一致性和办公效率。

大模型服务小助手

1,164

探索云世界

2025-08-05

817

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

817

阿里云云原生

2024-05-15

93579

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,579

硅步

2024-09-27

809

灵魂拷问-前端的作用--性能优化篇

作者最近在尝试对负责的平台进行性能优化，本文整理了些前端性能优化的一些常见策略。

硅步

809

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

探索LLM推理全阶段的JSON格式输出限制方法

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

Qwen-MT：翻得快，译得巧

当 OpenTelemetry 遇上阿里云 Prometheus

灵魂拷问-前端的作用--性能优化篇

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

探索LLM推理全阶段的JSON格式输出限制方法

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

Qwen-MT：翻得快，译得巧

当 OpenTelemetry 遇上阿里云 Prometheus

灵魂拷问-前端的作用--性能优化篇