官方博客-第6页-阿里云开发者社区

尹斌斌周絮

2025-03-21

753

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

753

子白

2024-05-15

102416

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,416

隆基

2024-05-15

109225

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,225

阿里云云原生

2024-09-25

741

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

741

太业

2024-09-27

800

跟着iLogtail学习容器运行时与K8s下日志采集方案

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

太业

800

濯光于怀

2025-04-07

350

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

350

濯光翼严

2025-04-15

530

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

530

赫曦

2024-05-15

93156

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,156

吴昆

2024-05-15

222061

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,061

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

解决隐式内存占用难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

新场景、新能力，AI-native 时代的可观测革新

跟着iLogtail学习容器运行时与K8s下日志采集方案

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Kube Queue：Kubernetes 任务排队的利器

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

解决隐式内存占用难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

新场景、新能力，AI-native 时代的可观测革新

跟着iLogtail学习容器运行时与K8s下日志采集方案

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Kube Queue：Kubernetes 任务排队的利器