TorchEasyRec 在 macOS 上的功能限制总结

简介: 本文总结tzrec在macOS上的功能限制:核心依赖(如torchrec、fbgemm-gpu、graphlearn等)无法安装;分布式训练、原生数据管线、Embedding模块、Triton/CUDA算子、TDM树模型等功能完全不可用;优化器与模型导出部分失效;单元测试大多因强依赖而失败。

tzrec 在 macOS 上的功能限制总结

一、核心依赖缺失(无法安装在 macOS 上)

依赖 用途 影响范围
torchrec 分布式 Embedding 分片、KeyedJaggedTensor、TrainPipeline 几乎所有模型和训练流程
fbgemm-gpu GPU 高性能 Embedding 算子、WeightDecayMode 优化器、Embedding 计算
graphlearn 图采样(TDM 树模型) TDM 系统、图数据采样
common_io MaxCompute 数据读写 ODPS 数据集
confluent_kafka Kafka 流式数据 Kafka 数据集

二、不可用的功能模块

1. 分布式训练(完全不可用)

  • main.py 中的 train_and_evaluate 深度依赖 torchrec 的 DistributedModelParallel、TrainPipelineSparseDist、CombinedOptimizer、apply_optimizer_in_backward 等
  • torchrun 多 GPU/多节点训练无法使用
  • Embedding 分片规划 (plan_util.py) 依赖 EmbeddingShardingPlanner

2. 原生数据管线(不可用)

  • datasets/utils.py:Batch 类依赖 KeyedJaggedTensor、Pipelineable
  • datasets/data_parser.py:依赖 JaggedTensor、KeyedJaggedTensor
  • datasets/odps_dataset.py:依赖 alibabacloud_credentials
  • datasets/odps_dataset_v1.py:依赖 common_io
  • datasets/kafka_dataset.py:依赖 confluent_kafka
  • datasets/sampler.py:依赖 graphlearn

3. 原生 Embedding 模块(不可用)

  • modules/embedding.py:EmbeddingBagCollection、ManagedCollisionEmbeddingBagCollection 等均来自 torchrec
  • DynamicEmb (utils/dynamicemb_util.py):依赖 torchrec 分片类型

4. 优化器(部分不可用)

  • optim/optimizer.py:依赖 fbgemm_gpu 的 split_table_batched_embeddings_ops_training
  • optim/optimizer_builder.py:依赖 fbgemm_gpu 的 WeightDecayMode
  • torchrec 的 apply_optimizer_in_backward(稀疏 Embedding 优化器)

5. 模型导出(不可用)

  • utils/export_util.py:导出为 RTP/EAS 格式需要 torchrec 的 ShardedModule、quantize_embeddings、DistributedModelParallel 等

6. Triton/CUDA 算子加速(不可用)

  • ops/_triton/:Triton kernel 需要 NVIDIA GPU
  • HSTU 注意力、位置编码的 Triton 加速路径(DLRM-HSTU 模型相关)

7. TDM 树模型(不可用)

  • 依赖 graphlearn 做图采样(树构建、树检索、树聚类)


相关文章
|
14天前
|
机器学习/深度学习 分布式计算 搜索推荐
PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎
PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。
139 9
|
13天前
|
人工智能 数据可视化 机器人
OpenClaw一键部署攻略,手把手教你 “养龙虾”!
还在为部署OpenClaw踩坑发愁?“养龙虾”其实超简单!本文奉上阿里云一键云端部署攻略:全程可视化、零代码,仅两步——买预装服务器+填API密钥,5分钟即可拥有专属AI数字员工!支持微信/钉钉协同、文件处理、日程管理、代码辅助等,新手友好,成本低廉(新用户首月9.9元+7000万Token免费额度)。
364 25
|
14天前
|
人工智能 弹性计算 自然语言处理
阿里云企业上云重磅福利来袭!5 亿算力补贴 + 10 万出海扶持全攻略
阿里云推出“企业上云第一站”活动:新迁云企业享最高5亿算力补贴,出海企业可申领10万元专项扶持金;另含199元/年云服务器、1元首年域名、AI Tokens、云数据库低至88元/年等多重优惠,覆盖建站、协同办公、AI创新等全链路,助力企业降本增效、加速数字化与出海升级。
163 11
|
13天前
|
弹性计算 人工智能 小程序
阿里云ECS云服务器部署 OpenClaw 图文步骤:微信小程序集成+千问Qwen3.6-Plus配置+避坑指南
2026年,OpenClaw(原Clawdbot)作为开源AI代理自动化框架的标杆产品,凭借轻量化部署、跨平台兼容、大模型生态完善、即时通讯集成便捷的核心优势,成为个人与团队搭建专属智能助手的首选方案。阿里云ECS云服务器以稳定可靠、弹性扩展、安全可控、性能强劲的特性,为OpenClaw提供7×24小时不间断运行的理想环境,彻底解决本地部署断电、断网、公网无法访问的痛点。
259 2
|
13天前
|
人工智能 自动驾驶 安全
AI时代程序员必看!揭秘Harness Engineerin
当AI批量写代码,程序员会失业吗?OpenAI实验显示:3名工程师+1500个AI智能体,5个月完成100万行代码——人类零编码!关键不在模型,而在“Harness Engineering”系统工程法:以规格书、质检台、工具架构建AI“自动驾驶”体系,重塑程序员为架构师、规则者与工具锻造师。
|
14天前
|
机器学习/深度学习 搜索推荐 数据处理
PAI-Rec推荐开发平台:企业级智能推荐解决方案,驱动业务全域增长
PAI-Rec是阿里云一站式推荐系统平台,集成多路召回、多目标精排(如DBMTL)、GPU加速推理与灵活迭代能力,已助力电商、直播、音视频等多行业提升点击率、转化率与ROI,实现高效、低成本、可自主演进的智能推荐。
156 16
|
20天前
|
人工智能 弹性计算 数据可视化
部署OpenClaw有哪些成本?附OpenClaw低成本部署指南
OpenClaw(“养龙虾”)是一款开源AI代理框架,可自动化文件处理、工作流与消息管理。本文详解其部署成本:软件免费,云服务器低至68元/年,阿里云百炼新用户享7000万Token免费额度,并提供一键图形化部署指南。
604 32
|
9天前
|
安全 Java 索引
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
78 12
|
12天前
|
人工智能 弹性计算 自然语言处理
阿里云轻量应用服务器部署OpenClaw应用镜像,以及OpenClaw集成QQ图文教程
本文介绍了购买阿里云轻量应用服务器并部署OpenClaw应用镜像的步骤,包括相关计费说明、购买流程、配置细节及常见问题。还阐述了如何将OpenClaw集成到QQ机器人中,实现自然语言交互,涵盖创建QQ机器人及集成步骤。通过本文,用户能够掌握从本地部署到QQ集成的完整路径,实现定制化AI助理在QQ场景下的高效应用。
下一篇
开通oss服务