开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI feature_config中设置embedding_name 实现部分特征共享?

问题1:机器学习PAI feature_config中设置embedding_name 实现部分特征共享embedding,这个操作能降低模型大小吗?
问题2:我把输入特征分成了两个共享embedding组,模型和权重文件大小反而增加了(3.5M--> 3.6M, 1.9M --> 2.1M)是因为配置的问题吗?

展开
收起
真的很搞笑 2023-08-14 14:44:42 75 0
1 条回答
写回答
取消 提交回答
  • 回答1: 共享embedding ,是可以降低模型大小
    回答2:rawfeature 分桶的好像不行吧fa331a5bfacdbc9dfcbabbd66bb434e3.png
    应该是idfeature 和tagfeature 才行48b31d27193d5624479a5b20f1869f5e.png
    看了一下代码,应该是配置了embedding_name 就会放在一起。 但是RawFeature不同boundary 分桶号一样放一起比较奇怪。 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-08-14 15:14:35
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载