零幺_个人页

个人头像照片 零幺
个人头像照片
0
21
0

个人介绍

毕业于北京邮电大学,2016年4月加入蚂蚁金服人工智能部,目前主要负责大规模机器学习算法开发与应用方向的研发工作。

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2016-05-24

    关于数据切换

    引用楼主datamole于2016-05-24 15:48发表的 关于数据切换 :
    请问现在数据已经更新了么?
    [url=https://bbs.aliyun.com/job.php?action=topost&tid=282921&pid=tpc][/url]


    Yes.

    -------------------------

    Re:Re关于数据切换
    引用第2楼cstju于2016-05-24 17:29发表的 Re关于数据切换 :
    我有一个问题,为什么测试集更换会导致分数下降呢?
    测试集中不一直是该用户在该地点12月份的购买商家集么?
    难道之前的购买商家集并不是该用户在该地点12月份购买的商家全集?

    In stage1, we evaluate F1 score in half of the merchant set, which means we drop all records in respect of the other half during evaluation. In stage2, all merchants are involved into the evaluation. So if your submissions tend to overfit the purchase behaviors in stage1's merchants, they may fail to generalize in stage2's merchant set.


    I have just checked the leaderboard and found that team "711" have got 0.435885, which is close to the top score in stage1. So just keep on trying new ideas. Good luck!





    -------------------------

    Re:回 楼主datamole的帖子
    引用第3楼datamole于2016-05-24 21:07发表的 回 楼主datamole的帖子 :
    请问一下,是不是实际上提供下载的四个表格其实都没有改变,只是线上平台原来只评测ijcai2016_koubei_test中的一个子集,所谓“Evaluation set updates”是指测试时换了另一个子集?

    换句话说,我们并不需要重新下载并更新赛题数据? [url=https://bbs.aliyun.com/job.php?action=topost&tid=282921&pid=790949][/url]


    We evaluate on all records of "ijcai2016_koubei_test", not another subset.


    You don't need to download or update any file or data. Just keep on improve the generalization of your model.
    踩0 评论0
  • 回答了问题 2016-05-19

    关于测评程序问题

    引用楼主zofy于2016-05-19 22:36发表的 关于测评程序问题 :
    我想问下如果提交的答案里面有两行记录 user1,loc1,merchant1 和user1,loc1,merchant2,这个提交的效果是不是和user1,loc1,merchant1:merchant2等同呢?


    还有如果merchant1和merchant2相同的话,是不是两条记录等于一条记录? [url=https://bbs.aliyun.com/job.php?action=topost&tid=282433&pid=tpc][/url]


    According to our evaluator,
    1. Yes.
    2. Yes.


    But I suggest that your submission should follow the format described in Table 4.
    踩0 评论0
  • 回答了问题 2016-05-13

    提交的结果和表4的顺序不一样会影响测试结果吗

    引用楼主雷公斤于2016-05-13 10:47发表的 提交的结果和表4的顺序不一样会影响测试结果吗 :
    例如,表4中第一行是 753792,112,而我提交的结果中,753792,112,8888:888:88位于第36行。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=281669&pid=tpc][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-05-13

    IJCAI数据量大,单机处理不了

    引用楼主andyweizhao于2016-05-10 18:39发表的 IJCAI数据量大,单机处理不了 :
    请问有没有适合团队协作并且支持spark的云平台? [url=https://bbs.aliyun.com/job.php?action=topost&tid=281301&pid=tpc][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-05-08

    后期会转向御膳房平台上操作么

    引用楼主tangguowupan于2016-05-07 19:31发表的 后期会转向御膳房平台上操作么 :
    我看网上其他比赛似乎是在御膳房平台上操作的。我们这个比赛后期是否也是要转移到上面呢? [url=https://bbs.aliyun.com/job.php?action=topost&tid=280970&pid=tpc][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-05-07

    训练集合中11月1日的数据到11月20日的数据是否有所删减

    引用楼主sunleeshabi于2016-05-07 17:52发表的 训练集合中11月1日的数据到11月20日的数据是否有所删减 :
    在赛题中有:
    [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]Due to both business and noise concerns, we remove data in the great promotion period. That is, Nov. 01-Nov. 20 in Table 1 and Dec.12 in Table 4.
    我们查看了训练集发现数据并没有被删除,麻烦问一下原因。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280963&pid=tpc][/url]


    Really? Do you mean data in Nov. 01-Nov. 20 in Table 4? Actually we remove the data in these days from Table 1, not Table 4 or Table 2.
    踩0 评论0
  • 回答了问题 2016-05-04

    关于budget的问题

    引用楼主april牛牛于2016-05-03 17:21发表的 关于budget的问题 :
    对于需要预测的数据,实际中每个merchant被购买的次数都没有超过budget吗 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280430&pid=tpc][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-05-04

    赛题提供的口碑的商家都包含什么?只有外卖?

    引用楼主yumizju于2016-05-03 22:11发表的 赛题提供的口碑的商家都包含什么?只有外卖? :
    赛题提供的口碑的商家,是只有外卖的商家吗?

    [url=https://bbs.aliyun.com/job.php?action=topost&tid=280453&pid=tpc][/url]

    No. You can try our product to obtain more information.
    踩0 评论0
  • 回答了问题 2016-05-04

    关于locationid的问题

    引用楼主lucky_next于2016-05-04 22:59发表的 关于locationid的问题 :
    请问location_id的精度大概是多少,是具体到城市,还是区,街道?
    是否只有user的location_id与merchant的location_id相同时,user才有可能到merchant消费?还是说user也可能会到与其location_id不同的merchant消费?
    谢谢。
    [url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=tpc][/url]

    A Location can be a shopping mall or a street or just an area in which several merchants gather.

    I am not very clear about your second question. Would you please give more detail about it?

    -------------------------

    Re:回 楼主luckynext的帖子
    引用第2楼lucky_next于2016-05-05 12:32发表的 回 楼主luckynext的帖子 :
    比如假设在测试集中有一条是用户A,location_id是1,那么对这一条测试来说,用户A是不是只可能到location_id为1的merchant消费?存不存在用户A到location_id不是1的merchant消费的情况?
    谢谢。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=784666][/url]

    Of course yes. Users may buy in more than one location during Dec., 2015. In this situation, there exists more than one line in Table 4 for each of them.

    -------------------------

    Re:Re关于locationid的问题
    引用第3楼gyf123于2016-05-08 22:26发表的 Re关于locationid的问题 :
    同问 [url=https://bbs.aliyun.com/job.php?action=topost&tid=280628&pid=785689][/url]

    Of course yes. Users may buy in more than one location during Dec., 2015. In this situation, there exists more than one line in Table 4 for each of them.
    踩0 评论0
  • 回答了问题 2016-05-03

    表4用户问题

    引用楼主lxlx于2016-05-03 11:16发表的 表4用户问题 :
    请问表4中的用户和位置是12月份真实的用户和购买位置么?会出现用户在其位置没有购买任何商家的情况么?
    望解答,谢谢! [url=https://bbs.aliyun.com/job.php?action=topost&tid=280373&pid=tpc][/url]

    No. We guarantee that each line in Table 4 means user_id actually buy from some merchants in location_id.
    踩0 评论0
  • 回答了问题 2016-04-28

    Table3的疑问

    引用楼主ictcxq于2016-04-27 22:51发表的 Table3的疑问 :
    题目所说,Table3的 [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]budget是12月份的商户的budget。能否提供前几个月的budget信息。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=279905&pid=tpc][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-04-25

    表3疑问

    引用楼主houjp_nsd于2016-04-25 20:09发表的 表3疑问 :
    您好,如果一个merchant在不同位置有多个分店(也就是location_id_list > 1),那么这个budge是所有分店的总和吗?谢谢! [url=https://bbs.aliyun.com/job.php?action=topost&tid=279655&pid=tpc][/url]

    Yes.
    踩0 评论0
  • 回答了问题 2016-04-25

    评测指标具体是如何计算的?

    引用楼主奥利氧于2016-04-22 19:15发表的 评测指标具体是如何计算的? :
    虽然网站上给出了评测指标的计算方法的说明,但是总觉得它较为抽象。能否给出具体的例子?



    We add a Q&A about evaluation example in FAQ (https://tianchi.shuju.aliyun.com/competition/faq.htm?spm=5176.100067.5678.3.hVOQvh&raceId=231532).
    踩0 评论0
  • 回答了问题 2016-04-24

    表4数据问题

    引用楼主houjp_nsd于2016-04-24 15:14发表的 表4数据问题 :
    您好,表4中的<user_id, location_id>是如何构造的?表4中提供的<user_id, location_id>是否表示12月份的时候 user_id 表示的用户一定在 location_id 表示的位置进行过消费?这里缺少说明,是否可以提供详细信息,谢谢!

    [url=https://bbs.aliyun.com/job.php?action=topost&tid=278832&pid=tpc][/url]

    Yes. According to our dataset, <user_id, location_id> in Table 4 means user_id actually bought from one or more merchants in location_id during Dec., 2015.
    踩0 评论0
  • 回答了问题 2016-04-23

    赛题描述问题

    引用楼主houjp_nsd于2016-04-23 21:25发表的 赛题描述问题 :
    [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]Remark 1: Due to both business and noise concerns, we remove data in the great promotion period. That is, Nov. 01-Nov. 20 in Table 1 and Dec.12 in Table 2.
    [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]

    表2中并不包括12月份的数据,为什么会提到说删除12.12这一天的数据呢? [url=https://bbs.aliyun.com/job.php?action=topost&tid=278795&pid=tpc][/url]

    Great comment. Actually we remove Dec. 12 in Table 4, not Table 2.


    We will fix this mistake later. Thanks.
    踩0 评论0
  • 回答了问题 2016-04-23

    budget对于一个用户重复购买一个商品是否认为只消费一个budget.

    引用楼主sunleeshabi于2016-04-23 21:15发表的 budget对于一个用户重复购买一个商品是否认为只消费一个budget. :
    对于用户在一个月重复购买,到底是算消费了商品的一次budget还是多次? [url=https://bbs.aliyun.com/job.php?action=topost&tid=278793&pid=tpc][/url]

    We only consider unique tuples (user, location, merchant) in evaluation. Namely, one tuple costs one budget of the corresponding merchant.
    踩0 评论0
  • 回答了问题 2016-04-23

    比赛和数据问题

    Re:Re比赛和数据问题
    引用第3楼leolz于2016-04-23 20:17发表的 Re比赛和数据问题 :
    测试集中的两维分别是什么?

    The first column means user_id and the second column means location_id.


    You need to predict that user_id will buy from which merchants in location_id during Dec., 2015, and output your prediction in the third column as your submission.

    -------------------------

    Re:Re比赛和数据问题
    引用第4楼leolz于2016-04-23 20:21发表的 Re比赛和数据问题 :
    Table1中的Seller_id和Table2,Table3中的Merchant_id是一个吗? [url=https://bbs.aliyun.com/job.php?action=topost&tid=277891&pid=781239][/url]

    No.
    踩0 评论0
  • 回答了问题 2016-04-23

    2个关于题目理解的问题

    引用楼主代达罗斯于2016-04-22 23:29发表的 2个关于题目理解的问题 :
    您好,两个问题!
    1. Merchant_id_list里说每个用户最多可以列出10个Merchant,如果我列出大于10个Merchant,评测时是只能查到前10个Merchant吗?10个Merchant是表明在 真实情况下每个用户在Location最多只能有10个Merchant吗?
    2. 如果我预测一个User12月内在一个Location重复购买多次同样的商品,那么是只写一个Merchant还是每个都写?我觉得根据Budget本身的定义(constraints)和最后的评测手段,似乎应该考虑重复购买多次的情况。。。 [url=https://bbs.aliyun.com/job.php?action=topost&tid=278731&pid=tpc][/url]


    1. First, there is only a few (less than five) users in the testing set who buy items from more than 10 merchants in single location. Second, it’s quite common for a recommender system to refer a limited number item/merchant to a user.


    2. We only consider unique tuples (user, location, merchant) in evaluation. Namely, though User u buy multiple items from Merchant m in Location l, the tuple (u, m, l) should be recommended only once. On the other hand, you may recommend (u, m, l1) and (u, m, l2) simultaneously when you believe User u buy items from Merchant m in both Location l1 & l2.


    We will update the FAQ page later.
    踩0 评论0
  • 回答了问题 2016-04-22

    数据集描述有误

    Re:Re数据集描述有误
    引用第2楼兵与卒于2016-04-22 22:19发表的 Re数据集描述有误 :
    数据下载到本地,操作系统win7,解压后,生成ijcai2016_koubei_test文件,加了csv后缀之后,数据格式n行2列,不是跟描述中的n行3列,求解 [url=https://bbs.aliyun.com/job.php?action=topost&tid=278289&pid=781008][/url]


    你好,ijcai_2016_koubei_test文件是本次比赛的测试集,提供的文件有User_id和Location_id两个字段,第三个字段Merchant_id_list需要参赛者建模预测后补充上,并以此作为submission文件提交。

    -------------------------

    Re:ReReRe数据集描述有误
    引用第5楼stefanchou于2016-04-24 22:36发表的 ReReRe数据集描述有误 :
    引用第3楼零幺于2016-04-22 23:39发表的 Re:Re数据集描述有误 :


    你好,ijcai_2016_koubei_test文件是本次比赛的测试集,提供的文件有User_id和Location_id两个字段,第三个字段Merchant_id_list需要参赛者建模预测后补充上,并以此作为submission文件提交。

    ....... [url=https://bbs.aliyun.com/job.php?action=topost&tid=278289&pid=781461][/url]

    No. You can drop some lines in 'ijcai_2016_koubei_test' if you want to. I think this may yield better precision but worse recall sometime.
    踩0 评论0
  • 回答了问题 2016-04-22

    数据下载需要提取码?

    再发一个帖子。。
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息