ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

370

茏城

2024-06-28

116

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

116

阿里云PolarDB

2023-08-22

2842

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

2,842

阿里云PolarDB

2023-09-11

892

典型场景 | PolarDB-X 如何支撑SaaS多租户

很多平台类应用或系统（如电商CRM平台、仓库订单平台等等），它们的服务模型是围绕用户维度（这里的用户维度可以是一个卖家或品牌，可以是一个仓库，等等）展开的。因此，这类型的平台业务，为了支持业务系统的水平扩展性，业务的数据库通常是按用户维度进行水平切分。

阿里云PolarDB

892

木烟

2024-06-24

45723

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中，如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

木烟

45,723

阿里云实时计算Flink

2023-03-30

4477

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,477

阿里云实时计算Flink

2023-04-13

861

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

861

ModelScope

2024-05-15

326

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

326

ModelScope

2024-05-15

217

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

217

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

深度｜大模型时代下，基于湖仓一体的数据智能新范式

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

典型场景 | PolarDB-X 如何支撑SaaS多租户

多环境镜像晋级/复用最佳实践

Apache Paimon 在同程旅行的探索实践

海量数据实时分析引擎 Apache Flink

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术