TorchEasyRec 在 macOS 上的功能限制总结

简介: 本文总结tzrec在macOS上的功能限制:核心依赖(如torchrec、fbgemm-gpu、graphlearn等)无法安装;分布式训练、原生数据管线、Embedding模块、Triton/CUDA算子、TDM树模型等功能完全不可用;优化器与模型导出部分失效;单元测试大多因强依赖而失败。

tzrec 在 macOS 上的功能限制总结

一、核心依赖缺失(无法安装在 macOS 上)

依赖 用途 影响范围
torchrec 分布式 Embedding 分片、KeyedJaggedTensor、TrainPipeline 几乎所有模型和训练流程
fbgemm-gpu GPU 高性能 Embedding 算子、WeightDecayMode 优化器、Embedding 计算
graphlearn 图采样(TDM 树模型) TDM 系统、图数据采样
common_io MaxCompute 数据读写 ODPS 数据集
confluent_kafka Kafka 流式数据 Kafka 数据集

二、不可用的功能模块

1. 分布式训练(完全不可用)

  • main.py 中的 train_and_evaluate 深度依赖 torchrec 的 DistributedModelParallel、TrainPipelineSparseDist、CombinedOptimizer、apply_optimizer_in_backward 等
  • torchrun 多 GPU/多节点训练无法使用
  • Embedding 分片规划 (plan_util.py) 依赖 EmbeddingShardingPlanner

2. 原生数据管线(不可用)

  • datasets/utils.py:Batch 类依赖 KeyedJaggedTensor、Pipelineable
  • datasets/data_parser.py:依赖 JaggedTensor、KeyedJaggedTensor
  • datasets/odps_dataset.py:依赖 alibabacloud_credentials
  • datasets/odps_dataset_v1.py:依赖 common_io
  • datasets/kafka_dataset.py:依赖 confluent_kafka
  • datasets/sampler.py:依赖 graphlearn

3. 原生 Embedding 模块(不可用)

  • modules/embedding.py:EmbeddingBagCollection、ManagedCollisionEmbeddingBagCollection 等均来自 torchrec
  • DynamicEmb (utils/dynamicemb_util.py):依赖 torchrec 分片类型

4. 优化器(部分不可用)

  • optim/optimizer.py:依赖 fbgemm_gpu 的 split_table_batched_embeddings_ops_training
  • optim/optimizer_builder.py:依赖 fbgemm_gpu 的 WeightDecayMode
  • torchrec 的 apply_optimizer_in_backward(稀疏 Embedding 优化器)

5. 模型导出(不可用)

  • utils/export_util.py:导出为 RTP/EAS 格式需要 torchrec 的 ShardedModule、quantize_embeddings、DistributedModelParallel 等

6. Triton/CUDA 算子加速(不可用)

  • ops/_triton/:Triton kernel 需要 NVIDIA GPU
  • HSTU 注意力、位置编码的 Triton 加速路径(DLRM-HSTU 模型相关)

7. TDM 树模型(不可用)

  • 依赖 graphlearn 做图采样(树构建、树检索、树聚类)


相关文章
|
19天前
|
存储 搜索推荐 PyTorch
为什么使用 TorchRec 训练和推理更快
本文结合TorchEasyRec实践,从四大维度解析推荐系统加速:1)KeyedJaggedTensor统一变长特征,实现Embedding批量融合查找;2)自动分布式分片突破单卡显存瓶颈;3)TrainPipelineSparseDist流水线并行,重叠通信与计算;4)fbgemm-gpu融合优化器,减少显存访问。端到端提升训练效率与扩展性。
171 9
|
27天前
|
人工智能 弹性计算 数据可视化
部署OpenClaw有哪些成本?附OpenClaw低成本部署指南
OpenClaw(“养龙虾”)是一款开源AI代理框架,可自动化文件处理、工作流与消息管理。本文详解其部署成本:软件免费,云服务器低至68元/年,阿里云百炼新用户享7000万Token免费额度,并提供一键图形化部署指南。
678 32
|
20天前
|
弹性计算 人工智能 小程序
阿里云ECS云服务器部署 OpenClaw 图文步骤:微信小程序集成+千问Qwen3.6-Plus配置+避坑指南
2026年,OpenClaw(原Clawdbot)作为开源AI代理自动化框架的标杆产品,凭借轻量化部署、跨平台兼容、大模型生态完善、即时通讯集成便捷的核心优势,成为个人与团队搭建专属智能助手的首选方案。阿里云ECS云服务器以稳定可靠、弹性扩展、安全可控、性能强劲的特性,为OpenClaw提供7×24小时不间断运行的理想环境,彻底解决本地部署断电、断网、公网无法访问的痛点。
321 2
|
20天前
|
人工智能 弹性计算 自然语言处理
阿里云企业上云重磅福利来袭!5 亿算力补贴 + 10 万出海扶持全攻略
阿里云推出“企业上云第一站”活动:新迁云企业享最高5亿算力补贴,出海企业可申领10万元专项扶持金;另含199元/年云服务器、1元首年域名、AI Tokens、云数据库低至88元/年等多重优惠,覆盖建站、协同办公、AI创新等全链路,助力企业降本增效、加速数字化与出海升级。
220 11
|
21天前
|
机器学习/深度学习 分布式计算 搜索推荐
PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎
PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。
176 9
|
20天前
|
人工智能 自动驾驶 安全
AI时代程序员必看!揭秘Harness Engineerin
当AI批量写代码,程序员会失业吗?OpenAI实验显示:3名工程师+1500个AI智能体,5个月完成100万行代码——人类零编码!关键不在模型,而在“Harness Engineering”系统工程法:以规格书、质检台、工具架构建AI“自动驾驶”体系,重塑程序员为架构师、规则者与工具锻造师。
|
19天前
|
人工智能 弹性计算 自然语言处理
阿里云轻量应用服务器部署OpenClaw应用镜像,以及OpenClaw集成QQ图文教程
本文介绍了购买阿里云轻量应用服务器并部署OpenClaw应用镜像的步骤,包括相关计费说明、购买流程、配置细节及常见问题。还阐述了如何将OpenClaw集成到QQ机器人中,实现自然语言交互,涵盖创建QQ机器人及集成步骤。通过本文,用户能够掌握从本地部署到QQ集成的完整路径,实现定制化AI助理在QQ场景下的高效应用。
|
16天前
|
安全 Java 索引
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
86 12
|
21天前
|
机器学习/深度学习 搜索推荐 数据处理
PAI-Rec推荐开发平台:企业级智能推荐解决方案,驱动业务全域增长
PAI-Rec是阿里云一站式推荐系统平台,集成多路召回、多目标精排(如DBMTL)、GPU加速推理与灵活迭代能力,已助力电商、直播、音视频等多行业提升点击率、转化率与ROI,实现高效、低成本、可自主演进的智能推荐。
189 16