ModelScope

2024-05-15

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

206

易霏夏花

2024-08-16

7355

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,355

阿里云PolarDB

2023-08-22

2895

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

2,895

瑞丹

2023-11-09

436

Dataphin实时研发实践—电商场景下的实时数据大屏构建

实时数据大屏是实时计算的重要应用场景之一，广泛应用在电商业务中，用于实时监控和分析电商平台的运营情况。通过大屏展示实时的销售额、订单量、用户活跃度、商品热度等数据指标，帮助业务人员随时了解业务的实时状态，快速发现问题和机会。同时，通过数据可视化和趋势分析，大屏也提供了决策支持和优化运营的功能，帮助业务人员做出及时的决策和调整策略，优化电商业务的运营效果。下面以电商业务为背景，介绍如何构建经典实时数仓，实现实时数据从业务库到ODS层、DWD层、DWS层全链路流转，基于Dataphin和Quick BI实现实时数据大屏。

瑞丹

436

ModelScope

2024-05-15

423

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

423

资源编排ROS

2024-09-10

37

ROS CDK魔法书：建立你的游戏王国（JavaScript篇）

本文介绍了如何利用阿里云资源编排服务（ROS）的云开发套件（CDK）将2048小游戏部署到云端。ROS CDK允许开发者使用编程语言定义和管理云资源，简化部署流程。通过部署示例，展示了从环境准备、依赖安装到资源栈的创建与删除全过程。借助ECS等云服务，实现游戏快速上线，使更多玩家享受游戏乐趣。

资源编排ROS

37

焱冰

2023-03-09

11488

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

焱冰

11,488

偏左

2023-08-28

20817

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,817

寒亭

2023-09-18

47154

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,154

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

Dataphin实时研发实践—电商场景下的实时数据大屏构建

vLLM部署Yuan2.0：高吞吐、更便捷

ROS CDK魔法书：建立你的游戏王国（JavaScript篇）

数据湖存储的安全写入之道

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

一次访问Redis延时高问题排查与总结（2）