开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇e22a2785f4cd82d6e65b4816e4c9800c.png
这个是离线fg的代码吗?

展开
收起
真的很搞笑 2023-12-10 17:01:34 57 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。

    但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。

    2023-12-11 13:44:31
    赞同 展开评论 打赏
  • 这个目前是分为两步,一个是 fg, 一个是 EasyRec 。fg 的话你只需要看到 fg 的结果满足你的要求就可以。EasyRec 的话你这个应该是只需要关注 EasyRec config 的配置就可以。序列之间的分隔符用 separator (详细处理过程见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L667) ,多值的分隔符用 seq_multi_sep (见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L668C23-L668C36) ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-12-11 13:06:32
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    机器学习及人机交互实战 立即下载