ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

362

元泊

2024-05-15

122

SLS：基于OTel的移动端全链路Trace建设思考和实践

本文探讨了移动端全链路Trace的建设思考和实践。

元泊

122

资源编排ROS

2019-12-24

1881

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,881

豁朗

2022-05-16

1797

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

1,797

吴昆

2024-05-15

145467

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,467

豁朗

2024-05-15

125409

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

豁朗

125,409

资源编排ROS

2024-06-04

611

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

611

木烟

2024-06-24

45718

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中，如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

木烟

45,718

阿里云存储

2024-06-26

25616

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,616

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

SLS：基于OTel的移动端全链路Trace建设思考和实践

资源编排ROS之自定制资源（基础篇）

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

弹性调度助力企业灵活应对业务变化，高效管理云上资源

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

多环境镜像晋级/复用最佳实践

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka