EasyRec和TorchEasyRec中FG NORMAL 和 FG DAG 的区别-阿里云开发者社区

EasyRec和TorchEasyRec中FG NORMAL 和 FG DAG 的区别

2026-04-06 179

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： TorchEasyRec提供两种特征生成模式：FG_NORMAL（Python逐特征处理，适合调试）与FG_DAG（C++ DAG引擎批量处理，性能更优、支持依赖、stub_type及自动侧识别）。推荐生产环境优先使用FG_DAG。

这两种模式都用于处理原始特征数据（raw feature），区别在于特征生成（Feature Generate）的执行方式。

定义：data.proto 中描述为 "we use python to run feature generate"
初始化时机：每个 feature 对象在创建时调用 init_fg()，各自独立创建一个 pyfg.FgArrowHandler 实例
处理方式：在 _parse_feature_normal 中，逐个特征调用 feature.parse(input_data) 进行 Python 层面的特征解析
输入名获取：通过遍历每个 feature 的 feature.inputs 属性获取所需的输入字段名
限制：不支持 stub_type（虚拟特征，中间特征）

定义：data.proto 中描述为 "we use fg_handler to run feature generate"
初始化时机：DataParser 构造时创建一个全局的 pyfg.FgArrowHandler（_init_fg_hander），它会根据所有特征的 fg_json 构建一个 DAG 计算图
处理方式：在 _parse_feature_fg_handler 中，一次性调用 self._fg_handler.process_arrow(input_data_fg) 把所有原始输入丢给 C++ 引擎，批量完成所有特征的生成
输入名获取：通过 fg_handler 的 user_inputs() / item_inputs() / context_inputs() API 获取，自动识别 user/item/context 侧
支持：stub_type（虚拟特征，中间特征）、特征间依赖（DAG 拓扑排序）、自动识别 is_user_feat

推荐使用 FG_DAG（大多数场景）：

使用 FG_NORMAL：

从 config_util.py 的兼容逻辑可以看出：旧配置中 fg_threads > 0 就对应 FG_DAG，否则对应 FGNORMAL。新配置直接通过 data_config.fg_mode 显式指定

EasyRec和TorchEasyRec中FG NORMAL 和 FG DAG 的区别