开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI这种在线学习的算法是把从评估结果来看,是把负样本没学进去吗?

eca7dcf13211ec4ab36b9e50ba00ac9c.png
机器学习PAI这种在线学习的算法是把从评估结果来看,是把负样本没学进去吗?

展开
收起
-Feng、冯冯 2024-01-05 02:36:19 39 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在线学习算法,如机器学习PAI,主要关注的是如何从用户的交互数据中进行实时学习并做出预测。对于负样本的处理,它通常采用从未有过行为的负样本中均匀采样出一些作为训练数据。这并不意味着负样本没有被学进去,而是为了更好地平衡正负样本的比例,确保模型能够更好地泛化到新的用户和场景。

    负采样主要是为了解决类别过多的问题,它提供了一种折中方案来处理大量的类别。在实际应用中,如果正负样本不均衡,还可以采用过采样或欠采样等方法来处理。

    总的来说,在线学习的目标是根据用户的实际行为进行实时调整和优化,而不是简单地分类正负样本。

    2024-01-06 13:37:14
    赞同 展开评论 打赏
  • 在线学习算法在处理负样本方面可能会有一些挑战。在传统的批量学习中,我们通常会有足够多的正负样本来进行模型训练。然而,在线学习中,我们只能看到一部分数据,而且这些数据通常是随着时间变化的。这意味着我们可能没有足够的负样本来学习模型的决策边界。

    为了解决这个问题,我们可以使用负采样(negative sampling)的方法。负采样的基本思想是从大量的负样本中随机选择一部分作为训练数据。这样可以减少计算量,同时也能保证模型能够学习到足够的负样本信息。

    然而,负采样也有一些缺点。首先,它可能会引入一些噪声,因为选择的负样本可能并不具有代表性。其次,如果负样本的数量远远大于正样本,那么负采样可能会使模型过度关注负样本,从而影响模型的性能。

    因此,在使用在线学习算法时,我们需要根据具体的问题和数据来选择合适的方法来处理负样本。

    2024-01-05 09:33:20
    赞同 展开评论 打赏

热门讨论

热门文章

相关电子书

更多
微博机器学习平台架构和实践 立即下载
机器学习及人机交互实战 立即下载
大数据与机器学习支撑的个性化大屏 立即下载