官方博客-第9页-阿里云开发者社区

米基

2024-05-15

3784

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,784

阿里云瑶池数据库

2024-06-25

24787

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,787

羽沐

2024-12-13

1980

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,980

ModelScope

2025-06-16

540

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

540

虎仔

2024-10-22

1181

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,181

ant-ray项目组

2025-04-11

1144

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,144

大模型服务小助手

2025-07-01

1159

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

本文介绍如何利用智能体与Python代码批量处理Excel中的脏数据，解决人工录入导致的格式混乱、逻辑错误等问题。通过构建具备数据校验、异常标记及自动修正功能的系统，将数小时的人工核查任务缩短至分钟级，大幅提升数据一致性和办公效率。

大模型服务小助手

1,159

阿里云开发者

2024-11-29

1123

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,123

灵杰开发者

2025-07-18

922

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

淘天集团数据开发团队基于Fluss构建新一代实时数仓，解决数据消费冗余、探查困难及大State运维难题。Fluss融合列存与实时更新能力，支持列裁剪、KV点查、Delta Join及湖流一体，显著降低IO与计算资源消耗，提升作业稳定性与数据探查效率。已在淘天AB实验平台落地，覆盖搜索、推荐等核心业务，通过618大促验证，实现千万级流量、秒级延迟，资源消耗降低30%，State缩减超100TB。未来将持续深化湖仓架构，拓展AI场景应用。

灵杰开发者

922

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

动态链接的魔法：Linux下动态链接库机制探讨

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

最佳实践：通义灵码生成单元测试，让单测更简单

AI开源框架：让分布式系统调试不再"黑盒"

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

动态链接的魔法：Linux下动态链接库机制探讨

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

最佳实践：通义灵码生成单元测试，让单测更简单

AI开源框架：让分布式系统调试不再"黑盒"

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列