ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

361

豁朗

2022-05-16

1796

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

1,796

阿里云AnalyticDB

2023-05-29

5373

AnalyticDB(ADB)+LLM，构建AIGC时代下企业专属Chatbot

如何基于向量数据库+LLM（大语言模型），打造更懂你的企业专属Chatbot。

阿里云AnalyticDB

5,373

吴昆

2024-05-15

145466

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,466

豁朗

2024-05-15

176

基于业务的告警管理最佳实践

本文主要介绍了SLS告警管理中心的业务概念和功能。

豁朗

176

言澈

2024-05-15

309

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

309

木烟

2024-06-24

45718

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中，如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

木烟

45,718

阿里云存储

2024-06-26

25616

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,616

阿里云云原生

2023-07-27

43393

一文详解Spring Bean循环依赖

本文主要梳理了Spring解决bean循环依赖的思路。

阿里云云原生

43,393

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

AnalyticDB(ADB)+LLM，构建AIGC时代下企业专属Chatbot

弹性调度助力企业灵活应对业务变化，高效管理云上资源

基于业务的告警管理最佳实践

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

多环境镜像晋级/复用最佳实践

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

一文详解Spring Bean循环依赖