开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI如果valid数据集量级太大严重影响评估效率和整体效率,这个有什么方法可以解呢?

机器学习PAI分布式训练的时候,需要valid数据集来早停。但是无论是分配master做评估还是separate模式,都是在单台机器上做推理,如果valid数据集量级太大严重影响评估效率和整体效率,这个有什么方法可以解呢?

展开
收起
cuicuicuic 2024-03-11 20:19:26 19 0
1 条回答
写回答
取消 提交回答
  • valid搞小一点,采样一下,不需要那么大 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2024-03-11 21:18:36
    赞同 展开评论 打赏

相关电子书

更多
大规模机器学习在蚂蚁+阿里的应用 立即下载
基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
基于Spark的大规模机器学习在微博的应用 立即下载