1. 抽样方式
有同学问“在训练集中,8百多个用户的行为是全集还是抽样的结果”
我们在做训练数据的时候,是首先从天猫全量用户中定了一个抽样比例,确定训练用户集User set。同样,在天猫全量品牌集合中,定了一个抽样比例,确定品牌集合Brand Set。大家拿到的这份数据,是User Set 中的用户在Brand Set 中的所有行为。
2. 测试集
问“如果一个用户在测试集中对一个品牌购买超过一次,是否要预测具体的购买次数”
答: 不需要的,只需要预测是否购买即可,不需要预测准确的数字。
3. 购买行为定义
问:点击“购买”就记录为一次购买,还是付款成功才算作一次购买?
答:付款成功才叫一次购买
问:代付款的话,购买行为计作购物人的还是代付人的?
答:如果用支付宝代付功能,这个不是很确定,等确定了再答复。
问:那如果有一个user,一次性买了n件商品(同一个brand),那么应该算是一次购买还是n次购买?
答:如果n 件商品不同,则是n 次购买。
问:对于一次购买(先加入购物车再购买),那么用户行为是否为“购买”,而没有“加入购物车”
答:不会,“加入购物车”与“购买”是独立行为,所以是一次“加入购物车”+一次“购买”
-------------------------
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。