ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

372

茏城

2024-06-28

118

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

118

弃余

2023-08-11

810

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

810

霜键

2024-05-15

112508

线程操纵术之更优雅的并行策略

本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。

霜键

112,508

王骜

2024-05-15

164916

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,916

ModelScope

2024-05-15

401

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

401

阿里云PolarDB

2023-08-22

2843

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

2,843

阿里云PolarDB

2023-09-11

893

典型场景 | PolarDB-X 如何支撑SaaS多租户

很多平台类应用或系统（如电商CRM平台、仓库订单平台等等），它们的服务模型是围绕用户维度（这里的用户维度可以是一个卖家或品牌，可以是一个仓库，等等）展开的。因此，这类型的平台业务，为了支持业务系统的水平扩展性，业务的数据库通常是按用户维度进行水平切分。

阿里云PolarDB

893

寒亭

2023-09-18

47107

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,107

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

深度｜大模型时代下，基于湖仓一体的数据智能新范式

Linux 内存管理新特性：Memory folios 解读

线程操纵术之更优雅的并行策略

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本加速低成本部署丨附教程

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

典型场景 | PolarDB-X 如何支撑SaaS多租户

一次访问Redis延时高问题排查与总结（2）

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

深度｜大模型时代下，基于湖仓一体的数据智能新范式

Linux 内存管理新特性：Memory folios 解读

线程操纵术之更优雅的并行策略

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本 加速低成本部署丨附教程

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

典型场景 | PolarDB-X 如何支撑SaaS多租户

一次访问Redis延时高问题排查与总结（2）

元象大模型开源30款量化版本加速低成本部署丨附教程