官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3784

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,784

阿里云瑶池数据库

2024-06-25

24787

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,787

ModelScope

2025-06-16

540

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

540

探索云世界

2025-08-05

813

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

813

虎仔

2024-10-22

1181

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,181

灵杰开发者

2025-08-08

618

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

618

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43720

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,720

ant-ray项目组

2025-04-11

1143

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,143

刘佳旭

2023-09-26

138996

云原生场景下高可用架构的最佳实践

刘佳旭

138,996

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Qwen-MT：翻得快，译得巧

最佳实践：通义灵码生成单元测试，让单测更简单

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

AI开源框架：让分布式系统调试不再"黑盒"

云原生场景下高可用架构的最佳实践

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Qwen-MT：翻得快，译得巧

最佳实践：通义灵码生成单元测试，让单测更简单

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

AI开源框架：让分布式系统调试不再"黑盒"

云原生场景下高可用架构的最佳实践