官方博客-第6页-阿里云开发者社区

子白

2024-05-15

102613

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,613

欧叔

2024-05-15

135911

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第6期，从客户真实实践场景出发，分享一些Timeline小技巧（AI_TTS、主轨道、素材对齐），助力客户降低开发时间与成本。

欧叔

135,911

青风义泊牧思

2024-09-03

971

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

971

元昌

2024-11-21

657

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

657

阿里云云原生

2025-01-07

380

Envoy 开启 HTTP2 后偶现 404 解决方法

在大部分基于 Envoy 实现的网关里，都存在这样一个问题，当开启 http2 时，客户端访问会出现偶发的 404，并且可以从日志注意到这些 404 的请求，:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书，且配置了多个域名的路由的情况下，这个问题特别容易出现。

阿里云云原生

380

片风

2025-01-14

637

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

637

望宸魁宇

2025-04-07

545

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

545

恶来

2023-05-15

7596

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,596

吴昆

2024-05-15

222176

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,176

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

面向OpenTelemetry的Golang应用无侵入插桩技术

构建理想容器镜像——以CSI为例

Envoy 开启 HTTP2 后偶现 404 解决方法

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

消息队列之 MetaQ 和 Kafka 区别和优势详解

Kube Queue：Kubernetes 任务排队的利器

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

面向OpenTelemetry的Golang应用无侵入插桩技术

构建理想容器镜像——以CSI为例

Envoy 开启 HTTP2 后偶现 404 解决方法

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

消息队列之 MetaQ 和 Kafka 区别和优势详解

Kube Queue：Kubernetes 任务排队的利器