TorchEasyRec 在 macOS 上的功能限制总结

简介: 本文总结tzrec在macOS上的功能限制:核心依赖(如torchrec、fbgemm-gpu、graphlearn等)无法安装;分布式训练、原生数据管线、Embedding模块、Triton/CUDA算子、TDM树模型等功能完全不可用;优化器与模型导出部分失效;单元测试大多因强依赖而失败。

tzrec 在 macOS 上的功能限制总结

一、核心依赖缺失(无法安装在 macOS 上)

依赖 用途 影响范围
torchrec 分布式 Embedding 分片、KeyedJaggedTensor、TrainPipeline 几乎所有模型和训练流程
fbgemm-gpu GPU 高性能 Embedding 算子、WeightDecayMode 优化器、Embedding 计算
graphlearn 图采样(TDM 树模型) TDM 系统、图数据采样
common_io MaxCompute 数据读写 ODPS 数据集
confluent_kafka Kafka 流式数据 Kafka 数据集

二、不可用的功能模块

1. 分布式训练(完全不可用)

  • main.py 中的 train_and_evaluate 深度依赖 torchrec 的 DistributedModelParallel、TrainPipelineSparseDist、CombinedOptimizer、apply_optimizer_in_backward 等
  • torchrun 多 GPU/多节点训练无法使用
  • Embedding 分片规划 (plan_util.py) 依赖 EmbeddingShardingPlanner

2. 原生数据管线(不可用)

  • datasets/utils.py:Batch 类依赖 KeyedJaggedTensor、Pipelineable
  • datasets/data_parser.py:依赖 JaggedTensor、KeyedJaggedTensor
  • datasets/odps_dataset.py:依赖 alibabacloud_credentials
  • datasets/odps_dataset_v1.py:依赖 common_io
  • datasets/kafka_dataset.py:依赖 confluent_kafka
  • datasets/sampler.py:依赖 graphlearn

3. 原生 Embedding 模块(不可用)

  • modules/embedding.py:EmbeddingBagCollection、ManagedCollisionEmbeddingBagCollection 等均来自 torchrec
  • DynamicEmb (utils/dynamicemb_util.py):依赖 torchrec 分片类型

4. 优化器(部分不可用)

  • optim/optimizer.py:依赖 fbgemm_gpu 的 split_table_batched_embeddings_ops_training
  • optim/optimizer_builder.py:依赖 fbgemm_gpu 的 WeightDecayMode
  • torchrec 的 apply_optimizer_in_backward(稀疏 Embedding 优化器)

5. 模型导出(不可用)

  • utils/export_util.py:导出为 RTP/EAS 格式需要 torchrec 的 ShardedModule、quantize_embeddings、DistributedModelParallel 等

6. Triton/CUDA 算子加速(不可用)

  • ops/_triton/:Triton kernel 需要 NVIDIA GPU
  • HSTU 注意力、位置编码的 Triton 加速路径(DLRM-HSTU 模型相关)

7. TDM 树模型(不可用)

  • 依赖 graphlearn 做图采样(树构建、树检索、树聚类)


相关文章
|
2月前
|
存储 搜索推荐 PyTorch
为什么使用 TorchRec 训练和推理更快
本文结合TorchEasyRec实践,从四大维度解析推荐系统加速:1)KeyedJaggedTensor统一变长特征,实现Embedding批量融合查找;2)自动分布式分片突破单卡显存瓶颈;3)TrainPipelineSparseDist流水线并行,重叠通信与计算;4)fbgemm-gpu融合优化器,减少显存访问。端到端提升训练效率与扩展性。
356 9
|
3月前
|
人工智能 安全 API
|
3天前
|
SQL JSON 关系型数据库
企业级多模态分析计算引擎选型:阿里云 AnalyticDB MySQL 统一分析平台方案
阿里云AnalyticDB MySQL版是PB级云原生实时数据仓库,首创多模态统一分析引擎,单SQL原生支持SQL分析、向量检索、全文搜索与JSON分析,替代3–5套独立系统,综合成本降50%+,运维复杂度降80%,适用于AI+数据融合、多源异构统一查询等企业级场景。
113 17
企业级多模态分析计算引擎选型:阿里云 AnalyticDB MySQL 统一分析平台方案
|
6天前
|
机器学习/深度学习 数据采集 人工智能
田间杂草检测数据集分享(适用于YOLO系列深度学习分类检测任务)
本数据集含4000张真实农田图像(小麦/玉米/水稻田),YOLO格式标注杂草目标,覆盖多天气、光照与视角,适用于YOLO系列等目标检测模型训练,助力智能除草与精准农业研究。(239字)
180 16
|
2月前
|
安全 Java 索引
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
122 12
|
10天前
|
人工智能 自然语言处理 API
阿里云海外重磅发布 Qwen Cloud
Qwen Cloud,正是为AI Agent 而生的全新服务方式。
728 24
|
17天前
|
人工智能 API 开发者
阿里云发布为Agent而生的全新AI产品官网“千问云”,模型服务全面Skill、CLI化
5月20日,阿里云发布“千问云”(www.qianwenai.com)——专为Agent时代打造的AI模型服务平台,集成150+主流模型API,首创Skills与CLI工具链,支持模型选型、调用、用量管理等全链路自动化,助力开发者与Agent高效构建AI应用。
1180 32
|
2月前
|
人工智能 数据可视化 机器人
OpenClaw一键部署攻略,手把手教你 “养龙虾”!
还在为部署OpenClaw踩坑发愁?“养龙虾”其实超简单!本文奉上阿里云一键云端部署攻略:全程可视化、零代码,仅两步——买预装服务器+填API密钥,5分钟即可拥有专属AI数字员工!支持微信/钉钉协同、文件处理、日程管理、代码辅助等,新手友好,成本低廉(新用户首月9.9元+7000万Token免费额度)。
627 25
|
2月前
|
人工智能 弹性计算 自然语言处理
阿里云企业上云重磅福利来袭!5 亿算力补贴 + 10 万出海扶持全攻略
阿里云推出“企业上云第一站”活动:新迁云企业享最高5亿算力补贴,出海企业可申领10万元专项扶持金;另含199元/年云服务器、1元首年域名、AI Tokens、云数据库低至88元/年等多重优惠,覆盖建站、协同办公、AI创新等全链路,助力企业降本增效、加速数字化与出海升级。
358 11
|
2月前
|
弹性计算 5G 云计算
2026年阿里云秒杀活动全攻略:时间、入口、抢购技巧
阿里云2026秒杀活动升级上线!新用户专享轻量服务器38元/年、9.9元/月起,每日10:00/15:00两场抢购。含实名认证要求、抢购技巧及68元/年起备选方案,助你低成本高效上云!
506 18