开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI easyrec做TagFeature特征输入时,怎么配置不做embedding层?

机器学习PAI easyrec做TagFeature特征输入时,怎么配置不做embedding层,直接将特征原值作为输入?不要使用Excel特征配置

展开
收起
真的很搞笑 2023-10-29 20:28:46 84 0
4 条回答
写回答
取消 提交回答
  • 在机器学习PAI中,EasyRec处理TagFeature特征时,如果不想使用embedding层,而是直接将特征原值作为输入,可以通过以下步骤进行配置:

    1. 首先,您需要创建一个RawFeature类型的字段,用于存储原始的标签信息。例如,如果您的标签信息是"体育,娱乐,科技"这样的字符串,那么您可以创建一个RawFeature类型的字段,将这些标签信息存储在这个字段中。

    2. 然后,在模型配置中,找到对应的特征配置部分。在这里,您可以指定这个RawFeature类型的字段作为模型的输入特征。

    3. 最后,由于您不想使用embedding层,所以在特征配置中,您需要将embedding_size设置为0。这样,模型在训练过程中就不会对这个特征进行embedding操作了。

    通过以上步骤,您就可以实现在EasyRec中使用TagFeature特征,但不使用embedding层,而是直接将特征原值作为输入的配置了。

    2023-10-31 16:34:09
    赞同 展开评论 打赏
  • 在阿里云的机器学习PAI(Platform for AI Innovation)中,如果你想在easyrec中使用TagFeature并且不进行embedding层,你可以直接在模型的定义文件中配置。

    在PAI的easyrec模型中,TagFeature是一个特殊的特征,它不会被embedding层处理,而是直接被输入到模型中。你可以在模型的定义文件中设置is_tag_feature字段为True,这样就可以将这个特征设置为TagFeature。

    以下是一个示例:

    {
        "name": "EasyRec",
        "type": "EasyRecModel",
        "inputs": [
            {
                "name": "user_id",
                "type": "int64",
                "is_sparse": false,
                "is_tag_feature": true
            },
            {
                "name": "item_id",
                "type": "int64",
                "is_sparse": false,
                "is_tag_feature": true
            }
        ],
        "outputs": [
            {
                "name": "prediction",
                "type": "float32"
            }
        ]
    }
    

    在这个示例中,user_iditem_id都被设置为TagFeature,它们的值将被直接输入到模型中,而不经过embedding层。

    2023-10-30 11:33:52
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在使用机器学习PAI easyrec训练模型时,可以使用 TagFeature 类型来输入原始特征值。在训练时,TagFeature 类型可以将原始特征值转换为可训练的形式。此外,还需要将 tag_column 和 embedding_size 参数设置为适当的值。需要注意的是,TagFeature 不支持嵌套结构,只能用于字符串类型的特征。总之,在机器学习PAI easyrec中,可以使用 TagFeature 类型来输入原始特征,并将tag_column 和 embedding_size 设置为适当的值。

    2023-10-29 22:33:56
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载