开发者社区> 问答> 正文

用户行为数据完整性和保序性的疑问

请问season1的数据是否满足以下两个条件:
1、完整性:我们所得到的数据是否包含了这一时间段(4.15-8.15)用户U在品牌B下发生的所有行为
2、保序性:数据中用户U在某一天针对品牌B的记录顺序是否与用户实际的行为发生顺序一致


即,如果数据中有如下两条相邻的记录A和B
[table=288,,,0][tr][td=1,1,72]6694750[/td][td=1,1,72]27149[/td][td=1,1,72]1[/td][td=1,1,72]5月19日[/td][/tr][tr][td]6694750[/td][td]27149[/td][td]0[/td][td]5月19日[/td][/tr][/table]


那么
1、A与B之间是否有可能还有其他数据但没有被采样
2、A是否一定发生在B之前

展开
收起
ruky 2014-03-20 14:30:36 6883 0
4 条回答
写回答
取消 提交回答
  • 回2楼樱木瞎折腾的帖子
    你的意思是不是这样:某个用户user_id对于第一件商品brand_id1的数据在所给时间段4.15~8.15之间是完整的,但是在该段时间内该用户对于第二件商品brand_id2的数据是没有的。还有一个问题是,如果情况如先前所述,有没有可能这样:用户甲的10件商品的操作记录被抽中了一大半,比如说甲的8件商品的操作记录在数据集中,而另一用户乙的10件商品操作记录只被抽中了1件?
    2014-03-30 21:00:26
    赞同 展开评论 打赏
  • 回2楼樱木瞎折腾的帖子
    如果不是按时间排序的那现有的排序是类似hash的结果还是按某种规则排序的?谢谢
    2014-03-30 18:10:16
    赞同 展开评论 打赏
  • 1、完整性:确保完整性,数据中包含了给出用户对某品牌下发生的所有行为。
    2、保序性:不是,数据中用户U在某一天针对品牌B的记录顺序不是与用户实际的行为发生顺序一致
    2014-03-20 18:34:35
    赞同 展开评论 打赏
  • 同求专家团解答!
    2014-03-20 17:15:56
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
代码未写,漏洞已出——谈谈设计不当导致的安全问题 立即下载
微信客户端怎样应对弱网络 立即下载
低代码开发师(初级)实战教程 立即下载