毕业于北京邮电大学,2016年4月加入蚂蚁金服人工智能部,目前主要负责大规模机器学习算法开发与应用方向的研发工作。
引用楼主datamole于2016-05-24 15:48发表的 关于数据切换 :
请问现在数据已经更新了么?
[url=https://bbs.aliyun.com/job.php?action=topost&tid=282921&pid=tpc][/url]
-------------------------
引用第2楼cstju于2016-05-24 17:29发表的 Re关于数据切换 :
我有一个问题,为什么测试集更换会导致分数下降呢?
测试集中不一直是该用户在该地点12月份的购买商家集么?
难道之前的购买商家集并不是该用户在该地点12月份购买的商家全集?
-------------------------
引用第3楼datamole于2016-05-24 21:07发表的 回 楼主datamole的帖子 :
请问一下,是不是实际上提供下载的四个表格其实都没有改变,只是线上平台原来只评测ijcai2016_koubei_test中的一个子集,所谓“Evaluation set updates”是指测试时换了另一个子集?
换句话说,我们并不需要重新下载并更新赛题数据? [url=https://bbs.aliyun.com/job.php?action=topost&tid=282921&pid=790949][/url]
引用楼主zofy于2016-05-19 22:36发表的 关于测评程序问题 :
我想问下如果提交的答案里面有两行记录 user1,loc1,merchant1 和user1,loc1,merchant2,这个提交的效果是不是和user1,loc1,merchant1:merchant2等同呢?
还有如果merchant1和merchant2相同的话,是不是两条记录等于一条记录? [url=https://bbs.aliyun.com/job.php?action=topost&tid=282433&pid=tpc][/url]
引用楼主雷公斤于2016-05-13 10:47发表的 提交的结果和表4的顺序不一样会影响测试结果吗 :
例如,表4中第一行是 753792,112,而我提交的结果中,753792,112,8888:888:88位于第36行。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=281669&pid=tpc][/url]
引用楼主andyweizhao于2016-05-10 18:39发表的 IJCAI数据量大,单机处理不了 :
请问有没有适合团队协作并且支持spark的云平台? [url=https://bbs.aliyun.com/job.php?action=topost&tid=281301&pid=tpc][/url]
引用楼主tangguowupan于2016-05-07 19:31发表的 后期会转向御膳房平台上操作么 :
我看网上其他比赛似乎是在御膳房平台上操作的。我们这个比赛后期是否也是要转移到上面呢? [url=https://bbs.aliyun.com/job.php?action=topost&tid=280970&pid=tpc][/url]
引用楼主sunleeshabi于2016-05-07 17:52发表的 训练集合中11月1日的数据到11月20日的数据是否有所删减 :
在赛题中有:
[font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]Due to both business and noise concerns, we remove data in the great promotion period. That is, Nov. 01-Nov. 20 in Table 1 and Dec.12 in Table 4.
我们查看了训练集发现数据并没有被删除,麻烦问一下原因。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280963&pid=tpc][/url]
引用楼主april牛牛于2016-05-03 17:21发表的 关于budget的问题 :
对于需要预测的数据,实际中每个merchant被购买的次数都没有超过budget吗 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280430&pid=tpc][/url]
引用楼主yumizju于2016-05-03 22:11发表的 赛题提供的口碑的商家都包含什么?只有外卖? :
赛题提供的口碑的商家,是只有外卖的商家吗?
[url=https://bbs.aliyun.com/job.php?action=topost&tid=280453&pid=tpc][/url]
引用楼主lucky_next于2016-05-04 22:59发表的 关于locationid的问题 :
请问location_id的精度大概是多少,是具体到城市,还是区,街道?
是否只有user的location_id与merchant的location_id相同时,user才有可能到merchant消费?还是说user也可能会到与其location_id不同的merchant消费?
谢谢。
[url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=tpc][/url]
-------------------------
引用第2楼lucky_next于2016-05-05 12:32发表的 回 楼主luckynext的帖子 :
比如假设在测试集中有一条是用户A,location_id是1,那么对这一条测试来说,用户A是不是只可能到location_id为1的merchant消费?存不存在用户A到location_id不是1的merchant消费的情况?
谢谢。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=784666][/url]
-------------------------
引用第3楼gyf123于2016-05-08 22:26发表的 Re关于locationid的问题 :
同问 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=785689][/url]
引用楼主lxlx于2016-05-03 11:16发表的 表4用户问题 :
请问表4中的用户和位置是12月份真实的用户和购买位置么?会出现用户在其位置没有购买任何商家的情况么?
望解答,谢谢! [url=https://bbs.aliyun.com/job.php?action=topost&tid=280373&pid=tpc][/url]
引用楼主ictcxq于2016-04-27 22:51发表的 Table3的疑问 :
题目所说,Table3的 [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]budget是12月份的商户的budget。能否提供前几个月的budget信息。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=279905&pid=tpc][/url]
引用楼主houjp_nsd于2016-04-25 20:09发表的 表3疑问 :
您好,如果一个merchant在不同位置有多个分店(也就是location_id_list > 1),那么这个budge是所有分店的总和吗?谢谢! [url=https://bbs.aliyun.com/job.php?action=topost&tid=279655&pid=tpc][/url]
引用楼主奥利氧于2016-04-22 19:15发表的 评测指标具体是如何计算的? :
虽然网站上给出了评测指标的计算方法的说明,但是总觉得它较为抽象。能否给出具体的例子?
引用楼主houjp_nsd于2016-04-24 15:14发表的 表4数据问题 :
您好,表4中的<user_id, location_id>是如何构造的?表4中提供的<user_id, location_id>是否表示12月份的时候 user_id 表示的用户一定在 location_id 表示的位置进行过消费?这里缺少说明,是否可以提供详细信息,谢谢!
[url=https://bbs.aliyun.com/job.php?action=topost&tid=278832&pid=tpc][/url]
引用楼主houjp_nsd于2016-04-23 21:25发表的 赛题描述问题 :
[font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]Remark 1: Due to both business and noise concerns, we remove data in the great promotion period. That is, Nov. 01-Nov. 20 in Table 1 and Dec.12 in Table 2.
[font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]
表2中并不包括12月份的数据,为什么会提到说删除12.12这一天的数据呢? [url=https://bbs.aliyun.com/job.php?action=topost&tid=278795&pid=tpc][/url]
引用楼主sunleeshabi于2016-04-23 21:15发表的 budget对于一个用户重复购买一个商品是否认为只消费一个budget. :
对于用户在一个月重复购买,到底是算消费了商品的一次budget还是多次? [url=https://bbs.aliyun.com/job.php?action=topost&tid=278793&pid=tpc][/url]
引用第3楼leolz于2016-04-23 20:17发表的 Re比赛和数据问题 :
测试集中的两维分别是什么?
-------------------------
引用第4楼leolz于2016-04-23 20:21发表的 Re比赛和数据问题 :
Table1中的Seller_id和Table2,Table3中的Merchant_id是一个吗? [url=https://bbs.aliyun.com/job.php?action=topost&tid=277891&pid=781239][/url]
引用楼主代达罗斯于2016-04-22 23:29发表的 2个关于题目理解的问题 :
您好,两个问题!
1. Merchant_id_list里说每个用户最多可以列出10个Merchant,如果我列出大于10个Merchant,评测时是只能查到前10个Merchant吗?10个Merchant是表明在 真实情况下每个用户在Location最多只能有10个Merchant吗?
2. 如果我预测一个User12月内在一个Location重复购买多次同样的商品,那么是只写一个Merchant还是每个都写?我觉得根据Budget本身的定义(constraints)和最后的评测手段,似乎应该考虑重复购买多次的情况。。。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=278731&pid=tpc][/url]
引用第2楼兵与卒于2016-04-22 22:19发表的 Re数据集描述有误 :
数据下载到本地,操作系统win7,解压后,生成ijcai2016_koubei_test文件,加了csv后缀之后,数据格式n行2列,不是跟描述中的n行3列,求解 [url=https://bbs.aliyun.com/job.php?action=topost&tid=278289&pid=781008][/url]
-------------------------
引用第5楼stefanchou于2016-04-24 22:36发表的 ReReRe数据集描述有误 :
引用第3楼零幺于2016-04-22 23:39发表的 Re:Re数据集描述有误 :
你好,ijcai_2016_koubei_test文件是本次比赛的测试集,提供的文件有User_id和Location_id两个字段,第三个字段Merchant_id_list需要参赛者建模预测后补充上,并以此作为submission文件提交。
....... [url=https://bbs.aliyun.com/job.php?action=topost&tid=278289&pid=781461][/url]
No. You can drop some lines in 'ijcai_2016_koubei_test' if you want to. I think this may yield better precision but worse recall sometime.