官方博客-第10页-阿里云开发者社区

米基

2024-05-15

3784

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,784

阿里云云原生

2024-05-16

57060

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,060

阿里云瑶池数据库

2024-06-25

24787

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,787

阿里云云原生

2024-09-06

1473

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

单点登录（SSO）可解决用户在多系统间频繁登录的问题，OIDC 因其标准化、简单易用及安全性等优势成为实现 SSO 的优选方案，本文通过具体步骤示例对 Higress 中开源的 OIDC Wasm 插件进行了介绍，帮助用户零代码实现 SSO 单点登录。

阿里云云原生

1,473

羽沐

2024-12-13

1980

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,980

ModelScope

2025-06-16

540

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

540

探索云世界

2025-08-05

813

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

813

虎仔

2024-10-22

1181

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,181

阿里云云原生

2025-04-23

924

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

924

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

动态链接的魔法：Linux下动态链接库机制探讨

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Qwen-MT：翻得快，译得巧

最佳实践：通义灵码生成单元测试，让单测更简单

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

动态链接的魔法：Linux下动态链接库机制探讨

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Qwen-MT：翻得快，译得巧

最佳实践：通义灵码生成单元测试，让单测更简单

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览