官方博客-第6页-阿里云开发者社区

子白

2024-05-15

102406

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,406

阿里云云原生

2024-05-15

55681

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,681

阿里云存储

2024-07-16

20426

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

20,426

坤硕

2024-07-29

20037

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,037

阿里云云原生

2025-01-26

1207

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,207

濯光于怀

2025-04-07

341

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

341

阿里云基础设施.

2025-05-01

351

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

351

赫曦

2024-05-15

93146

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,146

吴昆

2024-05-15

222049

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,049

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 全新 Wasm 运行时，性能大幅提升

几百T的视频、图片数据进行更有效地存储和管理

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

最近谈论 SSE 和 WebSocket 的人越来越多的原因

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

ACK AI Profiling：从黑箱到透明的问题剖析

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Kube Queue：Kubernetes 任务排队的利器

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 全新 Wasm 运行时，性能大幅提升

几百T的视频、图片数据进行更有效地存储和管理

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

最近谈论 SSE 和 WebSocket 的人越来越多的原因

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

ACK AI Profiling：从黑箱到透明的问题剖析

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Kube Queue：Kubernetes 任务排队的利器