官方博客-第8页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

阿里云云原生

2024-05-15

55685

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,685

言澈

2024-05-15

1430

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

本文是[全景剖析容器网络数据链路]第三部分，主要介绍Kubernetes Terway ENIIP模式下，数据面链路的转转发链路。

言澈

1,430

阿里云云原生

2024-09-25

736

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

736

柳遵飞

2024-11-22

1304

Spring Cloud+Nacos+KMS 动态配置最佳实践

本文讲述了 Spring Cloud 应用中结合 Nacos 实现了运行期配置动态更新的功能，以及在此基础上结合 KMS 在不改动代码的情况下对应用使用的敏感配置进行保护，解决将配置迁移到 Nacos 中可能存在的数据安全顾虑，并对其底层工作原理做了简单介绍。

柳遵飞

1,304

勉成

2024-12-12

559

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

559

尹丰彬

2025-02-21

806

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法，通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发，确保业务连续性与平滑迁移

尹丰彬

806

濯光于怀

2025-04-07

346

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

346

元乙

2023-11-06

128399

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

128,399

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 全新 Wasm 运行时，性能大幅提升

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

新场景、新能力，AI-native 时代的可观测革新

Spring Cloud+Nacos+KMS 动态配置最佳实践

如何找出Java进程占用CPU高的元凶

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

从存储统一到数据融合，SLS在可观测场景的思考和行动

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 全新 Wasm 运行时，性能大幅提升

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

新场景、新能力，AI-native 时代的可观测革新

Spring Cloud+Nacos+KMS 动态配置最佳实践

如何找出Java进程占用CPU高的元凶

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

从存储统一到数据融合，SLS在可观测场景的思考和行动