官方博客-第7页-阿里云开发者社区

阿里云云原生

2025-01-26

1209

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,209

尹斌斌周絮

2025-03-21

744

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

744

濯光于怀

2025-04-07

346

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

346

阿里云PolarDB

2023-08-22

3633

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

3,633

子白

2024-05-15

102408

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,408

吴昆

2024-05-15

222053

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,053

徒钟

2024-05-15

189455

Apache RocketMQ ACL 2.0 全新升级

RocketMQ ACL 2.0 不管是在模型设计、可扩展性方面，还是安全性和性能方面都进行了全新的升级。旨在能够为用户提供精细化的访问控制，同时，简化权限的配置流程。欢迎大家尝试体验新版本，并应用在生产环境中。

徒钟

189,455

遥方

2024-05-15

377

多账号共享一套ACR方案

一家多业务组织的客户来说往往会有多个云账号，分别部署各个业务线的容器服务。但集团可能想使用一套统一的容器镜像仓库（ACR），就会面临多账号内多个ACK共享一套ACR了。那如何合理规划好ACR实例上的命名空间，打通各个业务ACK集群与ACR的网络，包括如何精细化授权，都是客户需要考虑的。

遥方

377

阿里云云原生

2024-05-16

57006

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,006

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

解决隐式内存占用难题

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Apache RocketMQ ACL 2.0 全新升级

多账号共享一套ACR方案

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

解决隐式内存占用难题

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Apache RocketMQ ACL 2.0 全新升级

多账号共享一套ACR方案

容器内存可观测性新视角：WorkingSet 与 PageCache 监控