开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?

机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇e22a2785f4cd82d6e65b4816e4c9800c.png
这个是离线fg的代码吗?

展开
收起
cuicuicuic 2023-12-10 17:01:34 32 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,separator的确应用于多值特征的分割。例如,有些离散特征可能有多个取值,如一个人喜欢的NBA球队,有的人可能喜欢火箭和湖人,有的人可能只喜欢勇士,也有的人喜欢骑士、绿军、猛龙等一大堆。对于这种特征,需要使用separator进行正确的分隔处理。

    但需要注意的是,这里的separator不仅仅限于对离散特征的分割,它也可以应用于连续型特征的离散化处理。离散化的优势在于它可以映射到高维度空间,使线性的LR更快,且有更好的分割性;同时0,1向量内积乘法运算速度快,计算结果方便存储,容易扩展。

    2023-12-11 13:44:31
    赞同 展开评论 打赏
  • 这个目前是分为两步,一个是 fg, 一个是 EasyRec 。fg 的话你只需要看到 fg 的结果满足你的要求就可以。EasyRec 的话你这个应该是只需要关注 EasyRec config 的配置就可以。序列之间的分隔符用 separator (详细处理过程见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L667) ,多值的分隔符用 seq_multi_sep (见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L668C23-L668C36) ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-12-11 13:06:32
    赞同 展开评论 打赏

相关电子书

更多
微博机器学习平台架构和实践 立即下载
机器学习及人机交互实战 立即下载
大数据与机器学习支撑的个性化大屏 立即下载