开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI中user最大的点击序列长度、item的user序列长度是按1000截断的么?

机器学习PAI中user最大的点击序列长度、item的user序列长度是按1000截断的么?

展开
收起
冰激凌甜筒 2023-05-29 21:05:44 87 0
3 条回答
写回答
取消 提交回答
  • 值得去的地方都没有捷径

    在机器学习 PAI 中,用户点击序列长度和物品的用户序列长度是可以配置的,不一定按照 1000 截断。您可以在训练模型时,通过设置参数来控制这些长度。

    具体来说,在使用机器学习 PAI 训练模型时,您可以通过以下参数来配置用户点击序列和物品的用户序列的长度:

    max_user_behavior_length:用于控制用户点击序列的最大长度。默认值为 1000。

    max_user_interacted_items_length:用于控制物品的用户序列的最大长度。默认值为 1000。

    您可以根据您的数据集和模型需求,调整这些参数的值。例如,如果您的数据集中的用户点击序列或物品的用户序列较长,您可以将这些参数设置为更大的值,以充分利用数据。如果您的模型需要较短的序列,您可以将这些参数设置为较小的值。

    需要注意的是,设置这些参数的值时,应该考虑到您的计算资源和时间限制。如果您设置的值过大,可能会导致训练时间过长或内存不足。

    2023-05-30 16:38:47
    赞同 展开评论 打赏
  • 在机器学习 PAI 中,用户序列长度和物品序列长度是通过对实际序列进行截断得到的。默认情况下,用户序列长度和物品序列长度都是 1000。

    在实际应用中,数据集中的用户序列和物品序列长度可能会非常长,对于这种情况,我们需要对序列进行处理,以满足算法的输入要求和计算能力限制。一种处理方式是对序列进行截断,截断后的长度由超参数指定。在机器学习 PAI 的场景中,默认使用的是 1000 的长度截断方式。

    注意,对序列进行截断会丢失一部分信息,因此需要根据实际情况选择合适的截断长度。在模型训练过程中,可以通过超参数搜索等方式来找到最佳的截断长度,以获得最好的模型性能。

    2023-05-30 08:48:44
    赞同 展开评论 打赏
  • 6-700,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-05-29 21:55:23
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载