奶司

2024-05-15

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

374

元泊

2024-05-15

127

SLS：基于OTel的移动端全链路Trace建设思考和实践

本文探讨了移动端全链路Trace的建设思考和实践。

元泊

127

阿里云存储

2024-06-26

25623

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,623

刘佳旭

2023-09-26

138062

云原生场景下高可用架构的最佳实践

刘佳旭

138,062

ModelScope

2024-05-15

402

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

402

ModelScope

2024-05-15

372

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

372

弃余

2023-08-11

810

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

810

霜键

2024-05-15

112508

线程操纵术之更优雅的并行策略

本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。

霜键

112,508

王骜

2024-05-15

164916

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,916

类目筛选

内容类型

人人都是AI大师 - Prompt工程

SLS：基于OTel的移动端全链路Trace建设思考和实践

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

云原生场景下高可用架构的最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

vLLM部署Yuan2.0：高吞吐、更便捷

Linux 内存管理新特性：Memory folios 解读

线程操纵术之更优雅的并行策略

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

类目筛选

内容类型

人人都是AI大师 - Prompt工程

SLS：基于OTel的移动端全链路Trace建设思考和实践

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

云原生场景下高可用架构的最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

vLLM部署Yuan2.0：高吞吐、更便捷

Linux 内存管理新特性：Memory folios 解读

线程操纵术之更优雅的并行策略

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本加速低成本部署丨附教程