开发者社区> 问答> 正文

对菜鸟物流比赛的几点建议

今天看排行榜上的变化,有点诧异,昨天报名参赛的,第一次提交全国成本 [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]774981,总成本 [font=tahoma, Helvetica, 'Microsoft YaHei', 微软雅黑]1293067

相信很多选手看到这个全国成本都很惊恐吧,自己苦苦奋战却始终望尘莫及。
我觉得这个人有两种可能使用到的方法:
1、自己研究出来的黑科技
这个人很厉害,突然想到了一个吊炸天的方法,于是昨天立刻报名参赛,跑出来结果提交今天迅速登顶。如果是这样的话我真的很佩服并膜拜这样的大神。
2、作弊
这个方法对于降低全国成本是很可观的,也可以解释为什么他的全国成本能优化到这么低而分仓成本却依然这么高。
如何作弊?很简单,每次挑选一个补货成本高的商品,找两个号,提交两份结果,其中一份把该商品销量改为0,另一份改一个销量最大值,第二天根据这两个号的成本差推算出来线上真实的销量。
当然这也只是个人猜测而已,大家也可以发表自己的意见,但是问题确实是存在的,而且大家也希望比赛能够公平公正,不白白折腾这么久。
我对主办方的建议主要有:
1、在第一赛季的最后一次评测再次更换数据,以新数据成绩作为最后的成绩
2、增加private榜,这是常见的方法,每天公开的是public部分的成绩,以private榜的最好成绩作为最后的成绩
3、严肃查处作弊行为
最后,希望大家玩的开心!

展开
收起
江离丶泽漆 2016-05-09 12:23:04 8546 0
15 条回答
写回答
取消 提交回答
  • 你好,我们对凑数据问题提供以下的解决方案和说明:
    1.  我们会严格查最后提交前几名的代码,保证他们是用算法算出来的,而不是凑数据的出来的结果。
    2.  由于我们线下赛的数据可以提供下载,为了数据的安全性,所以不可能提供几十万的数据。同时,由于考虑到下载文件大小的问题,我们不能提供太多的数据。
    3. 我们线上赛的数据会有20万的商品,这样就很难出现凑数据的情况了。
    2016-05-11 10:04:36
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    建议这个比赛第一赛季的最终成绩就以一套新数据的第一次测评结果作为最终排名,理由如下:
    1. 虽然这有一定的偶然和运气成分,但是无可否认排名前5或者前10的人的算法很优秀,尽管可能不是最优秀的,但足以令人信服
    2. 这个比赛本来就是让我们预测未来,而预测未来通常只有一次机会,模型参数调整应该放在线下自己进行,而不是根据线上测评结果调整,(你能在高考考场上根据考试题型再选择复习哪部分内容吗?虽然我也觉得这次给的训练数据很烂,丢失数据太多,线下调模型结果不好)
    3.从根本上杜绝了刷小号,猜item真实值的方法。
    2016-05-10 12:42:58
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    希望官方人员注意该问题,不然比赛就会变成刷小号,通过测试榜上成本来得到销量高的item的真实销量,从而提升成绩。这种作弊行为也不好查处。呼吁广大参赛人员一同提议,为了比赛的公平公正而努力。
    2016-05-10 09:19:19
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    同意天音和yejiming的,private榜或者切换更多数据,数据量小的情况下,针对成本最高的TopK的线上不断反馈求差能求出具体的数值,成本确实能降低至少十几万,我相信这贴之后会有更多人尝试这种方法。官方如何检测小号其实难度很大,而且具体操作也很困难(因为要证明是小号,官方需要100%确定,需要证据),而且目前天池平台上也没有新例。后期检查代码也是在比赛结束,我们不希望排行榜尘埃落定才有所作为,目前来说对于靠前队伍而已确实不太公平。
    2016-05-09 20:06:56
    赞同 展开评论 打赏
  • hsl
    Re对菜鸟物流比赛的几点建议
    楼主真聪明
    2016-05-09 17:08:17
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议

    我觉得你说的作弊方式很难求解的。。。
    全国共有963个商品,如果一个全0得出一个结果,一个最大值得出一个结果,现在有963个未知数,也只能列出两个方程,一次963项式两个方程怎么求解???

    -------------------------

    回 17楼hitflame的帖子
    如果一个商品是可以求的,那就等换一批数据之后看看成本高低了。
    2016-05-09 17:00:46
    赞同 展开评论 打赏
  • 感谢您的建议,后续我们会不断优化评测方式。针对本场比赛,首先,需要队伍内所有成员完成支付宝实名认证,方可进入第一赛季最后阶段,否则队伍将被淘汰;其次,第一赛季截止时,我们会TOP队伍的代码进行检查。再次感谢您对天池大赛的支持与帮助!
    2016-05-09 15:12:45
    赞同 展开评论 打赏
  • 回 楼主云泛天音的帖子
    楼主真聪明!
    2016-05-09 15:08:21
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    支持private榜

    -------------------------

    回 12楼princes的帖子
    设某个val时cost非常大的item的补多的成本为a,补少的成本为b, 商品的真实销量为x。a,b为已知量,求x
    首先,提交一份结果,该item的全国销量设置为0,线上给出cost为c1
    然后, 提交一份结果, 该item的全国销量设置一个非常大的数设为n,线上给的cost为c2

    则:
    b*x-(n-x)*a=c1-c2
    这样,就可以求解出该item的全国销量x

    -------------------------

    Re对菜鸟物流比赛的几点建议
    还有一种方法避免作弊,官方设计一个评分函数,只要该函数和cost成单调关系即可,另外,该评分函数不公开,这样,大家看到的只有分数和排名,而不知道具体的cost是多少。想作弊,只有先求出这个评分函数。
    2016-05-09 14:41:28
    赞同 展开评论 打赏
  • 回 3楼岱月的帖子
    一般比赛的数据,像这样的作弊方式是没有意义的。但是这次比赛,第一数据量少,第二权重分布不均匀(只要猜到大头的几个商品的全国销量,总cost能低十来万),因此lz说的作弊是极有可行性以及可能性的。

    因此建议增加private榜,现在已经提供了第二部分数据,可以直接把第二部分中的三分之一作为public,另三分之二作为private,这种方式对你们来说工作量应该比其他方式小。另外在结束时对第一阶段前三需要做代码审查

    -------------------------

    回 12楼princes的帖子
    每次只调一个商品,有些商品的成本有几万的

    -------------------------

    回 11楼凝岚的帖子
    你们检查不见得能检查出问题

    举个例子,我现在说,对于个别商品,由于其数据比较异常,因此在模型预测后需要做一些调整,比如乘以2。这个策略是完全合理的,但是这个乘以多少的系数,完全可以在我猜测到正确销售量后做调整,这样就可以降低至少10万的cost
    2016-05-09 14:33:17
    赞同 展开评论 打赏
  • 回 4楼nnnnn12的帖子
    很多队都是开始队友各自分开提交,然后合并,请问哪里有问题么?
    两个重邮是因为有个是我队友,结果提交错了,后来不是解散掉了么
    现在另一个队友也另外组队了,建议可以增开Private榜,比赛结束提交代码检查结果
    2016-05-09 13:44:42
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    重邮好多队伍,之前提交的结果一模一样

    -------------------------

    我觉得最好的办法是商品种类增加,如果增到10万,那他的这点效果就微不足道了。当然,这次题目本身是个很难得的问题,确实需要有个黑科技来解决。

    -------------------------

    回 5楼bryan的帖子
    重邮实力很强,我也有重邮的同学。因为失误提交错了,可以理解。祝你们再接再厉,取得好成绩
    2016-05-09 13:31:28
    赞同 展开评论 打赏
  • 针对您说的情况,我们会进行排查的!谢谢!
    2016-05-09 13:14:51
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    支持!开小号太恶心了!
    2016-05-09 12:40:11
    赞同 展开评论 打赏
  • Re对菜鸟物流比赛的几点建议
    这种最后应该会被查代码
    2016-05-09 12:37:44
    赞同 展开评论 打赏
滑动查看更多
问答地址:
问答排行榜
最热
最新

相关电子书

更多
菜鸟在末端业务领域技术探索实践@大通-章天锋 立即下载
蚂蚁聚宝虫洞项目技术方案介绍 立即下载
菜鸟在末端业务领域技术探索实践 立即下载