开发者社区> 问答> 正文

数据的时间段貌似不对,请赛题方帮忙确认一下

貌似数据有些问题,还请赛题方帮忙确认一下: 根据赛题说明,提供从2015.07.01到2016.10.30(除去2015.12.12)的商家数据,用户支付行为数据以及用户浏览行为数据。可实际给定的数据,支付数据最小日期时 2015.06.26 6:00:00,用户浏览数据最小日期时 2016.06.22 00:00:00,跟赛题说明的数据日期不一致,而且相差很大,特别是浏览数据,我觉得正常来说浏览数据应该要比支付数据多的,现在数据文件中浏览数据明细比支付数据少太多了。

展开
收起
jlbookworm 2017-01-10 09:58:13 8108 0
11 条回答
写回答
取消 提交回答
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    请问一下,用户浏览的id是跟用户支付的id一一对应的吗?如果两个id一致是否是同一用户?
    2017-01-17 19:53:37
    赞同 展开评论 打赏
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    引用:
    "
    评测 Evaluation
    在这次比赛中,每只队伍需要预测测试集中所有商家在未来14天(2016.11.01-2016.11.14)内各自每天(00:00:00-23:59:59)的客户流量。


    数据 Data
    我们提供从2015.07.01到2016.10.30(除去2015.12.12)的商家数据,用户支付行为数据以及用户浏览行为数据。
    "  
    -----------------------
    问题: 2016.10.31数据归属
    2017-01-15 21:01:14
    赞同 展开评论 打赏
  • 回 22楼骞翮的帖子
    你好。在我整合数据后发现,某些商家有某段时间的数据是缺失的,例如:7月16日到8月10日的数据为空。这是正常的吗?还是我处理数据问题?
    2017-01-11 22:31:08
    赞同 展开评论 打赏
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    想请问下,对未来14天商家的客流量预测,仅仅是针对user_view和user_pay中的用户吗???也就是仅仅预测这两个表中的用户会不会去这些商家消费吗?

    -------------------------

    回 21楼骞翮的帖子
    谢谢你的回答.
    那还有一个问题:【user_view和user_pay中出现的所有用户集合】是不是完全等于【在shop_info中的所有商家进行消费的用户集合】,谢谢

    -------------------------

    回 24楼骞翮的帖子
    明白了,谢谢。
    2017-01-11 15:27:17
    赞同 展开评论 打赏
  • 回 16楼骞翮的帖子
    用户支付数据为什么不全?比如id为2的商铺,没有从2016-10-20到2016-10-09号的消费记录

    -------------------------

    回 26楼raychou的帖子
    这个问题我问过了
    商家可能在此期间因某些事项没有经营。因此没有产生消费记录。
    2017-01-11 13:49:50
    赞同 展开评论 打赏
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    请问,这个浏览不是肯定会进行的么?用户支付之前肯定会浏览口碑上的商家信息啊?这里为何能分开呢?

    -------------------------

    Re数据的时间段貌似不对,请赛题方帮忙确认一下
    不好意思问一下,这个口碑我其实不是很了解,这个口碑,主要指的是线上类似口碑外卖一样的东西呢?支付是不是发生在线上的呢?如果线下有支付那么线下对应的浏览时间应该统计不到吧?

    -------------------------

    回 22楼骞翮的帖子
    你好,谢谢您的回复,你的意思是说,user_pay表里面的记录全部都是来自实际线下用户消费的场景?不包含线上支付?就是不包含外卖的那种么?

    -------------------------

    回 29楼骞翮的帖子
    谢谢,现在全部全部都理解了。原来自己在线下支付和线上浏览的时候,所有的一切都会被记录下来。

    -------------------------

    回 32楼骞翮的帖子
    谢谢您,我可能口碑用的不多,我简单看了一下口碑,感觉和美团大众点评有点类似(但是没有团购功能)那么口碑是不是就是只是单纯的把线下的用户呈现到线上给用户看呢?(利用支付宝的流量),请问口碑和美团这些的差别是什么?

    -------------------------

    Re数据的时间段貌似不对,请赛题方帮忙确认一下
    想请官方回复一下,关于支付用户信息上面,为什么有很多都不是从20150701开始的?为什么有的是从2016年开始有的又晚一点,反正层次不齐,这一点作何解释呢?支付的统计时间不符合了?

    -------------------------

    回 35楼eric17的帖子
    同问
    2017-01-10 16:50:35
    赞同 展开评论 打赏
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    赛题说明中说:我们鼓励参赛选手使用类似天气等额外的数据,并希望参赛选手能够将数据源共享在论坛中。请问 这个额外的数据是必须要公开和共享吗?还是公开渠道可以获取到就行?
    2017-01-10 16:40:32
    赞同 展开评论 打赏
  • Re数据的时间段貌似不对,请赛题方帮忙确认一下
    商家的入驻时间是否早于 [font="]2015.07.01 ?谢谢!

    -------------------------

    Re数据的时间段貌似不对,请赛题方帮忙确认一下
    咨询下:1.具有相同编号的商家之间距离大概是个什么概念?有多近才算?两编号间差值有无实际意义?
    2.还是有点不明白,如何才算一次浏览行为?同一个用户两次打开口碑浏览同一个商家算2次行为?时间取的是整点,是在这个小时内发生的么?
    3.商家特征数据是在什么时间记录的?谢谢
    2017-01-10 15:32:11
    赞同 展开评论 打赏
  • 回 4楼骞翮的帖子
    请问,“单位时间内在商家使用支付宝消费的用户人次”,这个人次是怎么算的。一个人在一天内在这个店铺里面支付了2次,那么,人次 算2还是1?
    2017-01-10 15:15:39
    赞同 展开评论 打赏
  • 回 1楼骞翮的帖子
    请问 那么预测的是口碑上每天的店铺流量吗? 希望能更加准确的定义一下,麻烦了。

    -------------------------

    回 6楼骞翮的帖子
    现在没有疑问了
    2017-01-10 14:42:47
    赞同 展开评论 打赏
  • 你好!
    首先,这个数据本身并没有问题。
    支付数据的最早时间是在2015.07.01附近的,略有误差带来的不便请谅解。
    浏览数据是用户在口碑上点击浏览而产生的,并非曝光给用户的店铺,因此数量较少。另外,支付行为与浏览行为是分开记录的两者之间并没有明确的逻辑关系。而且浏览行为的记录相对较晚,保存期间较短。因此目前我们只能提供这个数量的数据。
    这里对浏览数据的开始时间说明问题带来的问题表示万分歉意。
    我们将尽力尝试提供一份额外的更长期间的浏览数据。

    -------------------------

    实际上一家店铺加入口碑之后就成为口碑店铺了,而且并没有口碑支付或者口碑用户的区分。所有的支付行为都是支付宝支付。
    具体的定义请看题目描述。实际上就是预测每个商家,每天支付宝支付的用户数量。
    不知道这样说是否清楚?

    -------------------------

    嗯,并不是必须浏览过的用户才被记录为客户流量的一部分。
    所有产生支付的用户人次都算。

    -------------------------

    2次,人次嘛。可以参考人流量的统计。

    -------------------------

    不一定,商家入驻时间是不确定的。
    我们只保证在预测期间11.01-11.14,商家在经营。

    -------------------------

    1. 如果有公开渠道获取,请在论坛里将渠道信息公开。如果没有公开渠道,请公布数据。最后提交结果的时候需要将额外数据和算法一并提交的。
    2. 不一定的,比如我是口碑老用户,我喜欢天天去同一家口碑商家吃饭。每次吃饭我都会使用支付宝支付,因此会被记录为客户流量,然而并非每次都需要打开口碑并浏览这个商家。

    -------------------------

    Re数据的时间段貌似不对,请赛题方帮忙确认一下
    1. 具有相同编号的商家距离在2km以内。编号差值并无意义。
    2. 你可以打开口碑具体尝试一下,如果点击进入一个商家的详细信息界面,算作是一次浏览行为。如果用户多次点击进入,自然算作多次浏览。时间方面进行了脱敏操作,是指在当前小时内发生的。
    3. 商家特征,比如评分和评论数量是2016年10月31日统计的。

    -------------------------

    首先,数据渠道必须公开,处理思路也要描述。
    具体数据上传问题具体分析。处理过的公开爬取的数据最后要上传到我们大赛的服务器,至于是不是在论坛公开由参赛者自己决定。如果是付费数据,不必上传,也不必公开。只要说明来源和处理思路即可。

    -------------------------

    Re数据的时间段貌似不对,请赛题方帮忙确认一下
    商家可能在此期间因某些事项没有经营。因此没有产生消费记录。

    -------------------------

    回 19楼georgieji的帖子
    并不仅仅针对user_view和user_pay中出现的用户,而是预测商家整体的客户流量。
    比如在已知的10月中,某些商家就迎来了新用户,也流失了某些老用户。

    -------------------------

    回 20楼seu1tyz的帖子
    口碑界面可以通过打开支付宝,最下面第二个标签“口碑”访问。各位选手可以自行体验一下。
    线上对口碑店铺的访问会被记录下来,成为user_view表。
    凡是使用支付宝在口碑商家( 非外卖消费,是到店消费)进行的支付行为都会被记录下来,成为user_pay表。
    因此线上的浏览行为与线下的消费行为并不一定会一一对应。

    -------------------------

    回 23楼georgieji的帖子
    user_pay的所有用户集合在2016年10月31日前等于在shop_info中商家消费的用户集合。
    有些用户产生了浏览行为但是没有进行过支付。因此你说的A集合应该是包含B集合的。
    注:出于保护用户隐私的目的,我们仅过滤掉一部分超高频交易的用户。其所占比例非常小,可以忽略不计。

    -------------------------

    回 28楼seu1tyz的帖子
    是的

    -------------------------

    回 31楼seu1tyz的帖子
    门店等级是口碑方面对店铺规模的一个评价。
    比如某个商家是一个私营个体户,那么他的门店等级就比较低。
    对于全国连锁的大型商家,其门店等级就比较高。

    -------------------------

    回 34楼seu1tyz的帖子
    支付表中层次不齐的问题的原因有很多。

    最直接的一个是,商家本身加入口碑的时间不一致。

    -------------------------

    回 37楼(seu1tyz) 的帖子
    打错了,抱歉。是到10月31日。

    -------------------------

    回 39楼(coder_yin) 的帖子
    是的,是一一对应的
    2017-01-10 14:26:11
    赞同 展开评论 打赏
滑动查看更多
问答地址:
相关问答
问答排行榜
最热
最新

相关电子书

更多
美团 crash 监控分析系统优化之路:crash 率从千分位到万分位 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载