开发者社区 问答 正文

天池新人实战赛之离线赛‘选手结果数据样例’存在问题

天池新人实战赛之[离线赛]:赛题与数据

评分数据格式 一节 以及 下载的文件 “选手结果数据样例.csv” 均无显示出这一情形:
某一 user_id 在 12.19 没有购买任何物品时,item_id应如何表示?仅仅不包含此 user_id及对应item_id即可?

另外,对于这一段
“训练数据包含了抽样出来的一定量用户在一个月时间(11.18~12.18)之内的移动端行为数据(D),评分数据是这些用户在这个一个月之后的一天(12.19)对商品子集(P)的购买数据。参赛者要使用训练数据建立推荐模型,并输出用户在接下来一天对商品子集购买行为的预测结果。 ”中的 “评分数据……的购买数据”:购买数据是指12.19当天的购买行为,还是截止当天是否已经购买的状态?

展开
收起
selay 2017-05-23 18:07:00 3937 分享 版权
阿里云 AI 助理回答

根据提供的知识库资料,针对您的问题,我们可以这样理解:

  1. 关于user_id在12.19没有购买任何物品时的表示方法

    • 在“选手结果数据样例.csv”中,如果某一user_id在12.19确实没有发生购买行为,那么该用户及其对应的item_id在提交的结果文件中自然不需要包含。即,您只需列出有实际预测购买行为的user_id及其对应的item_id即可。未发生的购买行为无需特别标记或表示,通过其不在结果文件中出现这一事实来体现。
  2. 关于“评分数据……的购买数据”的解释

    • 这段描述中的“评分数据是这些用户在这个一个月之后的一天(12.19)对商品子集(P)的购买数据”,明确指的是12.19当天的实际购买行为数据。这意味着,当提到“购买数据”时,它特指用户在12月19日这一天内完成的购买行为记录,并非截止到那一天的购买状态累计。参赛者需要基于训练期间(11.18~12.18)的行为数据预测用户在特定日期(12.19)对指定商品集合的实际购买情况。

综上所述,对于没有购买行为的用户,您无需在提交的结果文件中特别列出;而“评分数据”中的购买数据,是指12月19日这单一日期内的实际购买行为记录。

参考角标:[1] 天池新人实战赛之离线赛相关说明

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答
问答分类:
问答地址: