开发者社区> 问答> 正文

关于数据的几个问题,统一回答,请置顶

1. 抽样方式
    有同学问“在训练集中,8百多个用户的行为是全集还是抽样的结果”
    我们在做训练数据的时候,是首先从天猫全量用户中定了一个抽样比例,确定训练用户集User set。同样,在天猫全量品牌集合中,定了一个抽样比例,确定品牌集合Brand Set。大家拿到的这份数据,是User Set 中的用户在Brand Set 中的所有行为。


2. 测试集
    问“如果一个用户在测试集中对一个品牌购买超过一次,是否要预测具体的购买次数”
    答: 不需要的,只需要预测是否购买即可,不需要预测准确的数字。

3. 购买行为定义
    问:点击“购买”就记录为一次购买,还是付款成功才算作一次购买?
    答:付款成功才叫一次购买

    问:代付款的话,购买行为计作购物人的还是代付人的?
    答:如果用支付宝代付功能,这个不是很确定,等确定了再答复。

    问:那如果有一个user,一次性买了n件商品(同一个brand),那么应该算是一次购买还是n次购买?
    答:如果n 件商品不同,则是n 次购买。

    问:对于一次购买(先加入购物车再购买),那么用户行为是否为“购买”,而没有“加入购物车”
    答:不会,“加入购物车”与“购买”是独立行为,所以是一次“加入购物车”+一次“购买”


展开
收起
天猫_得福 2014-03-30 22:05:46 12005 0
6 条回答
写回答
取消 提交回答
  • Re关于数据的几个问题,统一回答,请置顶
    【问:对于一次购买(先加入购物车再购买),那么用户行为是否为“购买”,而没有“加入购物车”
        答:不会,“加入购物车”与“购买”是独立行为,所以是一次“加入购物车”+一次“购买”】

    有个疑惑,就数据集来看,几乎所有的购买行为之前,都少有购物车这一操作,不可能全都丢失了这一行为啊,那么,我疑惑的是,为什么会这样?

    是我理解错了么?

    【补充:刚刚再模拟了下购物流程,发现是自己理解错了,打扰了】

    -------------------------

    Re关于数据的几个问题,统一回答,请置顶
    【 问:代付款的话,购买行为计作购物人的还是代付人的?
        答:如果用支付宝代付功能,这个不是很确定,等确定了再答复。】

    这个问题有答复了没?
    2014-04-22 10:55:46
    赞同 展开评论 打赏
  • Re关于数据的几个问题,统一回答,请置顶
        问:那如果有一个user,一次性买了n件商品(同一个brand),那么应该算是一次购买还是n次购买?
        答:如果n 件商品不同,则是n 次购买。

    也就说,如果购买记录为1,也可能是购买了多个该品牌的同个商品?
    另外点击记录给n的话,也是指点击了n个该品牌的不同商品?点击记录为1的话,也可能是点击了该品牌的同个商品多次?

    这几个问题很关键,希望您能回答,谢谢!

    另外S2的数据粒度依然是精确到天吗?
    2014-04-14 09:08:24
    赞同 展开评论 打赏
  • 不错支持
    2014-04-07 09:45:07
    赞同 展开评论 打赏
  • Re关于数据的几个问题,统一回答,请置顶
    在数据中发现很多人购买之前都没有点击、购物车或收藏过商品,而且比例相当不正常,已经很难用“之前的行为没有在这4个月中”来解释了。

    请问:
    购买行为具体的含义是什么?
    点击“购买”就记录为一次购买,还是付款成功才算作一次购买?
    代付款的话,购买行为计作购物人的还是代付人的?


    请官方解答~

    ==========
    轉貼別人問題
    2014-04-06 23:36:01
    赞同 展开评论 打赏
  • Re关于数据的几个问题,统一回答,请置顶
    昨天和同学说起比赛,他一直有个疑问,今天我把这个疑问发到论坛上,不知道主办方能否解决

    万一最后一天前面几只队伍,公开算法,或者公开到他所在的学校,这样,之前成绩不理想的一些队伍,最后就可以得到一个很理想的成绩,于是TOP500里面剩下的就只剩前面几名的学校了。

    主办方如何看待这个问题,大家怎么看?
    2014-04-04 10:12:18
    赞同 展开评论 打赏
  • Re关于数据的几个问题,统一回答,请置顶
    测试集抽样论吗?
    2014-03-31 08:48:29
    赞同 展开评论 打赏
滑动查看更多
问答地址:
问答排行榜
最热
最新

相关电子书

更多
动态、高效,蚂蚁动态卡片的内核逻辑 立即下载
优化4K制作流程,创建“4K视觉云”服务 立即下载
QQ移动页面框架优化实践 立即下载