文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI行为序列里面的值，如何用共享embedding啊？

机器学习PAI行为序列里面的值，如何用共享embedding啊？行为序列里面没有 combiner，但是一个kv特征有combiner，然后会报shared embed info is not matched，要共享的是一个类别特征

展开

收起

真的很搞笑 2024-01-28 18:54:42 311 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

芯在这

我记得key 和seq是可以共享emb 的。在Feature config里面设置就好了
，此回答整理自钉群“【EasyRec】推荐算法交流群”

2024-01-28 22:25:18

赞同 1 展开评论
1941623231718325
在阿里云PAI机器学习平台中，如果你想让一个类别特征的embedding与行为序列特征共享同一个embedding矩阵，同时另一个KV特征也共享这个embedding矩阵，但KV特征有自己的combiner，而行为序列特征没有明确指定combiner，这可能会导致共享冲突。

行为序列特征通常会通过序列模型组件（如GRU、LSTM或Transformer等）来处理，这些组件内部会隐含地对序列中的元素进行某种形式的组合（combiner），而不是在特征层面显式定义。

解决共享embedding匹配问题，你可以按照以下步骤操作：
1. 确保所有要共享embedding的特征都在特征配置（FeatureConfig）中指定了相同的embedding_name属性，这样它们都会引用同一个嵌入层。
2. 对于KV特征，配置combiner以合并多个key的嵌入向量，例如使用combiner: "mean" 或 combiner: "sum"。
3. 对于行为序列特征，即使它没有明确的combiner属性，也需要确保在模型架构中正确处理序列特征的嵌入向量。序列模型通常会对序列元素逐个嵌入后再通过序列模型进行编码，而不是直接进行简单的向量组合。
4. 检查模型搭建时，序列特征经过嵌入层后，是否与其他特征在统一的维度上，以便后续能够进行合理的融合或连接操作。
如果仍然出现shared embed info is not matched的错误，可能的原因包括：
- 特征配置中的维度不一致。
- 序列特征在模型构建阶段没有正确地与共享的embedding矩阵对接。
- KV特征的combiner与序列特征处理方式之间存在逻辑冲突，比如序列特征已经隐含进行了某种形式的组合，而KV特征又进行了额外的组合。
2024-01-28 21:38:41

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

机器学习人工智能平台 PAI 人工智能平台 PAI行为人工智能平台 PAI序列人工智能平台 PAI行为序列人工智能平台 PAI pai

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

在机器学习PAI中，做Target Attention 这样做增强行为增强行为序列正样本的作用吗？

218

1

0

机器学习PAI的featurestore里的行为序列为啥有的数据能查到有的数据查不到那？

171

1

0

在稀疏模型训练中，TensorFlow处理Embedding特征查询时面临什么问题？

163

1

0

机器学习PAI的行为序列特征视图，是不能修改吗？只能删除重建？

177

1

0

机器学习PAI使用Flink写入行为序列时，报featureview not found是什么原因？

210

1

0

理解处理机器学习PAI行为序列这两个步骤对吗？

160

1

0

机器学习PAI的sequence featureview会保证T天行为表的实时性？

156

1

0

机器学习PAI有没有方法仅加载已知模型的embedding参数，上层再训练一个模型去更新参数啊？

200

1

0

机器学习PAI怎么能加载曝光->点击训练好的embedding参数，来更新cvr模型呢？

204

1

0

机器学习PAI Embedding提取后的向量，如何导入到polarDB4ai里面？

241

2

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

Gartner®首发云AI基础设施魔力象限，阿里云入选全球“领导者”

这段代码是AI写的吗？SemEval 2026任务13赛事回顾（下）

跨越仿真鸿沟：2026年Physical AI规模化落地关键技术突破

告别文字搜货低效痛点：1688图搜接口落地能力与核心解决问题全解析

公路裂缝目标检测数据集：3类别、2,000张图像 | 目标检测

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

请问在机器学习PAI里mc需要另外配置json函数库嘛？

阿里云百炼大模型怎么收费？要钱吗？

返回代码RISK.RISK_CONTROL_REJECTION

机器学习PAI现在有一个任务，启动命令将模型保存在oss上，但是任务运行报错？

阿里云百炼中，数据上传后，存储位置，安全性？

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

机器学习PAI的MAC 系统能运行 ALINK 吗

AGENT平台工作流上传pdf通过图片内容理解识别不了

阿里百炼大模型免费额度一点没有用，就直接收费了？

展开全部

【玩转数据系列四】听说啤酒和尿布很配？本期教你用协同过滤做推荐

【玩转数据系列七】有娃的注意了，机器学习教您如何提高孩子学习成绩

阿里大航杯AI电力大赛比赛分享及数加平台，机器学习pai使用经验

【教程】5分钟在PAI算法市场发布自定义算法

云端深度学习框架TensorFlow读取数据IO的高效方式

【玩转数据系列十六】机器学习PAI通过声音分辨男女（含语音特征提取相关数据和代码）

大规模深度学习优化技术在PAI平台中的应用及实践

【文本分析】新闻分类

【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战

PAI深度学习Tensorflow框架多机多卡多PS Server使用说明

展开全部

还有其他疑问?