官方博客-第5页-阿里云开发者社区

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

阿里云中间件

2024-07-23

15692

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,692

君启

2024-11-29

1201

性能提升利器｜PolarDB- X 超详细列存查询技术解读

本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案，以及其在优化 ORC 列存查询性能中的关键作用。

君启

1,201

阿里云云原生

2025-09-29

504

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

本文将分享我们在构建 SLS SQL Copilot 过程中的工程实践，展示如何基于阿里云 SLS 打造一套完整的 LLM 应用数据基础设施。

阿里云云原生

504

阿里云云原生

2024-05-16

57119

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,119

青风义泊牧思

2024-09-03

887

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

887

羿莉

2025-01-14

746

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

746

阿里云云原生

2025-05-06

1363

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,363

隆基

2024-05-15

108510

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,510

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

性能提升利器｜PolarDB- X 超详细列存查询技术解读

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

面向OpenTelemetry的Golang应用无侵入插桩技术

网络安全视角：从地域到账号的阿里云日志审计实践

MCP 规范新版本特性全景解析与落地实践

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

性能提升利器｜PolarDB- X 超详细列存查询技术解读

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

面向OpenTelemetry的Golang应用无侵入插桩技术

网络安全视角：从地域到账号的阿里云日志审计实践

MCP 规范新版本特性全景解析与落地实践

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？