测试数据集问题是否出现训练集没有的uid或bid(附样例)
Re测试数据集问题是否出现训练集没有的uid或bid(附样例)
我看zjueaglelab其中一个账号提交的结果里面有个很高的recall(41%). 是不是让每一个用户购买了所有的品牌?如果官方的ground truth是没有新品牌和用户,这时的recall应该是100%才对。
-------------------------
Re测试数据集问题是否出现训练集没有的uid或bid(附样例)
这样子,谢谢EagleEye提供的线索
-------------------------
回14楼test010的帖子
“预测提交所有的浏览记录均购买,那么召回率肯定有100%”对于这个判断我觉得不是正确的。你可以试一试。因为没有考虑已有用户与品牌之间的全部关系,还有就是新品牌,这样是不可能在线上有1000%的recall的。
全部组合输出确实有50M。下载下来的文件没有全部输出的情况多。
-------------------------
回2楼穿林越海的帖子
我觉得EagleEye的问题的出发点是说, 这个新的uid和bid会对我们本地的模型选择产生影响。要是不存在新的用户以及品牌,这样子的话还是很有信息量的。
赞0
踩0