官方博客-第18页-阿里云开发者社区

子白

2024-05-15

102423

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,423

吴昆

2024-05-15

222066

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,066

葳葳

2024-05-15

122605

每天一个摆脱if-else工程师的技巧，优雅的参数校验

在日常的开发工作中，为了程序的健壮性，大部分方法都需要进行入参数据校验。本文围绕作者如何优雅的进行参数校验展开讨论。

葳葳

122,605

阿里云瑶池数据库

2024-06-25

24751

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,751

鸥弋筱姜

2024-08-06

800

AI 创业及变现新思路：零门槛 AI 绘图，定制 ComfyUI Serverless API 应用

为了帮助用户高效率、低成本应对企业级复杂场景，本文介绍 ComfyUI API Serverless 版解决方案，通过使用该方案，用户可以充分利用 ComfyUI +Serverless 技术优势快速开发上线 AI 绘画应用，期待为广大开发者 AI 绘画创业及变现提供思路。

鸥弋筱姜

800

君启

2024-11-29

1109

性能提升利器｜PolarDB- X 超详细列存查询技术解读

本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案，以及其在优化 ORC 列存查询性能中的关键作用。

君启

1,109

涯海

2025-01-23

946

快速定位并优化CPU 与 JVM 内存性能瓶颈

本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

涯海

946

王晨

2025-04-03

797

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

797

阿里云开发者

2025-04-24

1130

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,130

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

每天一个摆脱if-else工程师的技巧，优雅的参数校验

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

AI 创业及变现新思路：零门槛 AI 绘图，定制 ComfyUI Serverless API 应用

性能提升利器｜PolarDB- X 超详细列存查询技术解读

快速定位并优化CPU 与 JVM 内存性能瓶颈

大模型上下文协议 MCP 带来了哪些货币化机会

为什么一定要做Agent智能体？

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

每天一个摆脱if-else工程师的技巧，优雅的参数校验

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

AI 创业及变现新思路：零门槛 AI 绘图，定制 ComfyUI Serverless API 应用

性能提升利器｜PolarDB- X 超详细列存查询技术解读

快速定位并优化CPU 与 JVM 内存性能瓶颈

大模型上下文协议 MCP 带来了哪些货币化机会

为什么一定要做Agent智能体？