开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI序列特征,每个item,框起来的那个对应多个tag怎么办呢?

机器学习PAI序列特征,每个item,框起来的那个对应多个tag怎么办呢?072520896e5b7a384c19097785863816.png

展开
收起
真的很搞笑 2024-01-16 12:38:44 66 0
2 条回答
写回答
取消 提交回答
  • 可以设置seq_multi_sep,sequence里面是多值特征的话。特征配置那里把多值的改成这样
    features: {
    input_names: 'tag_category_list'
    feature_type: SequenceFeature
    separator: ';'
    hash_bucket_size: 10000
    embedding_dim: 16
    seq_multi_sep:'|'
    }
    separator 是第一层分隔,seq_multi_sep 是第二层分隔符 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2024-01-16 13:33:01
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,如果序列特征中的每个item对应多个tag,可以使用多标签分类(Multi-label Classification)方法来处理。

    多标签分类是指将样本的标签划分为多个独立的二分类问题,即每个标签都是独立的二分类任务。对于序列特征中的每个item对应多个tag的情况,可以将每个tag看作是一个独立的二分类任务,然后使用适当的算法进行训练和预测。

    常用的多标签分类算法包括:

    1. Binary Relevance:将每个标签看作一个独立的二分类任务,分别训练模型并进行预测。
    2. Classifier Chains:将标签按顺序排列,前一个标签的输出作为后一个标签的输入,依次训练模型并进行预测。
    3. Label Powerset:将所有可能的标签组合看作一个整体,使用传统的多分类算法进行训练和预测。
    4. Adapted Algorithm:根据具体问题的特点,对传统的二分类算法进行修改和优化,以适应多标签分类任务。
    2024-01-16 12:52:27
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载