机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇e22a2785f4cd82d6e65b4816e4c9800c.png
这个是离线fg的代码吗?

展开
收起
真的很搞笑 2023-12-10 17:01:34 73 发布于黑龙江 分享
分享
版权
举报
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。

    但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。

    2023-12-11 13:44:31 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 这个目前是分为两步,一个是 fg, 一个是 EasyRec 。fg 的话你只需要看到 fg 的结果满足你的要求就可以。EasyRec 的话你这个应该是只需要关注 EasyRec config 的配置就可以。序列之间的分隔符用 separator (详细处理过程见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L667) ,多值的分隔符用 seq_multi_sep (见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L668C23-L668C36) ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-12-11 13:06:32 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

还有其他疑问?
咨询AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等