请问机器学习PAI对大量lookup特征进行分箱最好的方案是什么?

问题1:请问机器学习PAI对大量lookup特征进行分箱最好的方案是什么?
问题2:这个是按列来分箱对吧,但每个样本的lookup特征,在fg前是key-value格式, 在fg之后又都聚合成了一列,一般应该在fg之前还是之后分箱?

展开
收起
真的很搞笑 2023-09-13 15:55:50 84 分享 版权
1 条回答
写回答
取消 提交回答
  • 回答1:推荐算法定制里面有生成的代码。PAI 上有分箱的组件:https://help.aliyun.com/zh/pai/user-guide/binning
    回答2:在 fg 之后,需要把 fg split 开,推荐算法定制可以自动生成这个流程,你可以尝试一下看看。一个 split 开后的示例如下:,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-09-13 18:22:40
    赞同 展开评论

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

还有其他疑问?
咨询AI助理