开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI一个类别特征,emb共享 序列特征和一个kv特征,我这种应该怎么办呢?

"机器学习PAI一个类别特征,emb共享 序列特征和一个kv特征,
序列特征和kv特征的emb name一样,但是kv有combiner,序列是seq combiner
我这种应该怎么办呢?为什么要combiner一样呢?暂时没想明白~还是我对这个操作的具体方式哪里理解有误"

展开
收起
真的很搞笑 2024-01-28 19:39:58 56 0
2 条回答
写回答
取消 提交回答
  • sequence一般不需要combine吧,41665bb869d44b80673a5d2d2a7675b7.png
    应该是这里面要再定义一下 combiner,可以设置mean sum什么的,然后设置内部的combiner。 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2024-01-29 16:42:40
    赞同 展开评论 打赏
  • 在阿里云PAI机器学习平台上,当你处理多种类型的特征并进行嵌入(embedding)时,可能会遇到不同特征使用相同嵌入层的情况。这里的“emb name一样”指的是不同类型特征(如类别特征、KV特征、序列特征)共享相同的嵌入向量空间。

    序列特征(Sequence Feature)和键值对(Key-Value,KV)特征虽然都是高维稀疏特征,但它们的处理方式有所不同:

    • 序列特征(例如用户的浏览历史序列)通常会用到专门针对序列结构的嵌入方法,如SeqCombiner,它可以捕捉序列内部的上下文信息和顺序依赖性。

    • KV特征是由一组(key, value)对组成的特征,每一个key都有对应的value,这种特征更适合使用Embedding Lookup + Combiner的方式进行处理,这里的Combiner可能是Average、Sum、Concatenate等多种聚合策略,用于将多个key-value对映射后的嵌入向量进行综合。

    如果序列特征和KV特征确实需要使用相同的嵌入层(即共享同一份词典和嵌入向量),但在组合特征时采用了不同的Combiner,这是因为两种特征的结构和含义不同,因此在聚合嵌入向量时采取的策略也不同。

    解决办法:

    • 如果需要共享同一个嵌入层,那么在设计模型时,可以先对这两种特征分别做嵌入转换,然后依据特征的性质使用不同的Combiner,最后再将各自处理过的嵌入向量合并到一起参与后续的神经网络结构中。

    • 确保在PAI平台配置模型时,正确区分这两种特征的处理流程,即便它们共享同样的嵌入层名称,也要在模型结构中清晰地标记和区分它们所使用的Combiner类型。

    总结来说,即使特征共享相同的嵌入层,但由于特征本身的性质差异,可以并且应该根据特征的特点和需求来使用不同的组合方式(Combiner)。这样做有助于模型更好地理解和捕获不同特征表达的信息。

    2024-01-28 21:34:14
    赞同 展开评论 打赏

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载