官方博客-第5页-阿里云开发者社区

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

阿里云实时数仓Hologres

2024-06-07

130402

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

130,402

德歌

2023-09-14

25913

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

本文将带领大家来体验一下如何将“千问大模型+文本向量化模型”植入到PG|PolarDB中, 让数据库具备AI能力.

德歌

25,913

寒亭

2023-09-18

47959

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,959

隆基

2024-05-15

142884

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,884

言澈

2024-05-15

1267

全景剖析阿里云容器网络数据链路（四）—— Terway IPVLAN+EBPF

本文是[全景剖析容器网络数据链路]第四部分部分，主要介绍Kubernetes Terway EBPF+IPVLAN模式下，数据面链路的转转发链路。

言澈

1,267

阿里云云原生

2024-05-16

57120

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,120

阿里云云原生

2025-09-29

504

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

本文将分享我们在构建 SLS SQL Copilot 过程中的工程实践，展示如何基于阿里云 SLS 打造一套完整的 LLM 应用数据基础设施。

阿里云云原生

504

青风义泊牧思

2024-09-03

887

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

887

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

一次访问Redis延时高问题排查与总结（2）

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

全景剖析阿里云容器网络数据链路（四）—— Terway IPVLAN+EBPF

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

面向OpenTelemetry的Golang应用无侵入插桩技术

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

一次访问Redis延时高问题排查与总结（2）

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

全景剖析阿里云容器网络数据链路（四）—— Terway IPVLAN+EBPF

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

面向OpenTelemetry的Golang应用无侵入插桩技术