开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

求教一个机器学习PAI问题,这个emb共享是在共享combiner后的emb吗?

求教一个机器学习PAI问题,这个emb共享是在共享combiner后的emb吗?如果我有个要共享的特征,分别在 单独的id特征,kv特征,seq特征。共享id特征 就一个emb,没有要combiner的操作。kv特征 combiner:meanseq特征里面,序列的处理方式,不在特征上做combiner。该怎么办呢?另外,如果要共享的特征,本身是个多值特征,以上情况,又是怎么共享的呢?4a9b66b506812ed36689914da3f557fe.png

展开
收起
真的很搞笑 2024-03-04 11:57:46 54 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,要实现特征的embedding共享,通常需要确保这些特征具有相同的embedding_name。对于你提到的三种特征类型:单独的ID特征、KV特征和序列特征(seq特征),下面是一些建议:

    1. ID特征:如果你的ID特征不需要combiner操作,可以为这个特征创建一个独立的embedding,并指定一个唯一的embedding_name。这样,它就可以独立于其他特征进行嵌入学习。
    2. KV特征:对于KV特征,你已经提到了使用combiner(例如mean)来处理特征。如果你想共享类别特征的embedding,确保KV特征的embedding_name与要共享的类别特征的embedding_name相同。这样,它们就可以共享同一个embedding矩阵。
    3. 序列特征:序列特征通常不使用combiner,因为它们是按序列处理的。如果你想共享序列中的某个特定特征的embedding,你需要确保这个特征在序列中的表示与你想要共享的特征具有相同的embedding_name

    此外,关于多值特征的共享问题,多值特征通常指的是那些具有多个可能值的特征,例如一个ID特征可能有多个不同的ID值。在这种情况下,如果你想共享这样的特征,你需要确保所有想要共享的特征使用相同的embedding_name。这样,无论特征的具体值是什么,它们都会使用同一个embedding矩阵。

    综上所述,为了在机器学习PAI中实现特征的embedding共享,你需要确保想要共享的特征具有相同的embedding_name。对于不同类型的特征(ID、KV、序列),你可能需要根据特征的处理方式(是否需要combiner)来决定如何配置它们的embedding_name。对于多值特征,同样的原则适用,即共享的特征应该具有相同的embedding_name

    2024-03-04 21:51:46
    赞同 1 展开评论 打赏
  • 一般同一类的combiner都类似的吧,要么sum,要么mean,sequence的一般不会combine,idfeature设啥都不影响,共享combine之前的embedding, seq不需要combine, id也不需要combine ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2024-03-04 12:06:07
    赞同 1 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载