机器学习PAI在序列里RawFeature 共享emb会报错?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在使用阿里云机器学习平台PAI时,如果在序列(Sequence)中对RawFeature
类型特征尝试共享Embedding(即shared_names
字段的配置),可能会导致报错。以下是问题的原因分析及解决方法:
RawFeature
类型的限制
根据知识库中的描述,RawFeature
是连续值类特征,通常用于表示数值型数据(如价格、评分等)。这类特征在模型中一般不会直接共享Embedding,因为Embedding主要用于离散值特征(如IdFeature
或TagFeature
)。
shared_names
字段的适用范围
shared_names
字段仅适用于单个input_names
的特征,而不支持多个input_names
的特征(例如组合特征ComboFeature
)。如果尝试为RawFeature
配置shared_names
,可能会因不兼容而导致报错。
特征配置的不一致性
如果RawFeature
被错误地配置为需要共享Embedding,可能与模型的其他部分(如输入字段顺序或特征类型)产生冲突,从而引发错误。
RawFeature
类型的特征未被错误地配置为共享Embedding。
feature_configs
中,检查是否为RawFeature
设置了shared_names
字段。如果是,请移除该字段。feature_configs:
- input_names: ["price"]
feature_name: "price_feature"
input_type: "RawFeature"
# shared_names: ["other_feature"] # 移除此行
RawFeature
转换为离散值特征(如IdFeature
或TagFeature
)。
分箱
组件对RawFeature
进行离散化处理,将其转换为离散值特征后,再配置shared_names
字段。分箱
组件对RawFeature
进行等频或等距离散化。IdFeature
或TagFeature
进行配置。shared_names
字段以实现Embedding共享。input_fields
的字段顺序与MaxCompute表或CSV文件中的字段顺序一致。如果顺序不一致,可能会导致特征解析错误。RawFeature
的适用场景
RawFeature
通常用于直接输入到模型的连续值特征,建议不要尝试为其配置shared_names
字段。如果需要共享Embedding,请优先考虑离散值特征(如IdFeature
或TagFeature
)。
模型配置的兼容性
在修改特征配置后,务必重新检查整个模型的输入输出配置,确保各部分之间的兼容性。
通过以上步骤,您可以有效解决在序列中RawFeature
共享Embedding报错的问题。如果问题仍然存在,建议进一步检查模型的整体配置或联系技术支持获取帮助。您可以复制页面截图提供更多信息,我可以进一步帮您分析问题原因。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。