开发者社区> 问答> 正文

可以在赛程过半的时候改一次数据

RT
这样可以检验算法的普适性,防止一天一次测试导致的一些风险

展开
收起
偶也 2014-03-28 14:15:59 8412 0
13 条回答
写回答
取消 提交回答
  • 谢谢大家的投入和信任,主办方会尽可能的取缔马甲账号的。顶一下27楼的同学,只要付出努力进前500名应该问题不大,第二赛季才是真正的较量。
    2014-03-30 22:19:50
    赞同 展开评论 打赏
  • 西北工业大学-计算机软件与理论 蚂蚁金服-区块链平台部门
    回24楼好了,是我的帖子
    你的这个办法也太麻烦了,预选赛没必要搞得这么麻烦。只要取缔那些马甲账号和明显的作弊相同数据的账号。我相信有能力的人进top500是肯定没有问题的。毕竟是预选赛,楼主努力努力肯定能进session2。把精力放在算法上,像这些马甲呀什么的问题由主办方解决。优化自己的算法才是最重要的。
    2014-03-30 20:33:50
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    建议之间取缔那些一眼就可以看出是马甲的账号(比如说隔壁那个帖子。。。),这些马甲根本就是侮辱参赛者的智商啊
    2014-03-30 15:54:48
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    感觉中途换数据不太可行,毕竟分数没法算,况且session1只是预选赛。至于楼主提到的小号问题,希望阿里严查。

    -------------------------

    回6楼holdybb的帖子
    很同意

    -------------------------

    Re可以在赛程过半的时候改一次数据
    要是真的换数据的话,可以以两次数据的最高得分之和作为最终成绩。
    2014-03-29 22:11:25
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    小号的确应该处理一下,这样会打击很多人的热情。但小号的确不太便于甄别,但大多是同一学校的。是否可以这样:除top500的队伍可以晋级,增加一个学校排名,top200学校的第一名的队伍也可以晋级
    2014-03-29 14:37:32
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    现在就是在调参中,不过越调越烂,已经掉出top50了。。。
    对于这种现实中的数据,随机性非常大,用过于死板的算法往往达不到理想的效果。算法还是灵活一些比较好。
    2014-03-29 13:06:18
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    放心,这个不可行- -本身参数也是算法的一环。。。同意6楼,虽然我现在没进前500,但是同意这句话,写的勤上升的快。。抱怨只是没钻到算法里去- -而且人的特点都不一样,换了一组数据,算法虽然是普适的。。但是得分肯定会有差距- -

    -------------------------

    回10楼偶也的帖子
    想要普适性的算法就要拿出大量的数据来…所以普适性的算法是在s2提出来,这么低的数据量能提出普适的得分很高的吗…更何况,享受比赛就好……比不过别人的是我能力不够嘛~你一直在说算法的普适性,s1就只是入门,目的还是为s2大数据处理做准备的……

    -------------------------

    回13楼偶也的帖子
    如果这样的话,那现在测试的区分三个月和一个月的本地调参没什么区别。这样前些天的比赛基本没意义。。如果早想解决这种事情的话,应该减少比赛的天数~

    -------------------------

    回17楼偶也的帖子
    本来一周一测挺好的。。。谁知道怎么改成一天一测的。。
    2014-03-29 02:01:19
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    现在是参赛的过于过于不给力才对
    写写特征调调模型其实到6.x不难,一天一测只是让F1 score增长的更平缓罢了
    现在最高才7.2,这就调参大赛?差得还远呢吧
    一天一测最多是马太效应罢了,写得勤得上升得快,写得少的跌得也快
    2014-03-29 01:18:08
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    几天前就说了,调参大赛而已~呵呵
    2014-03-28 23:20:19
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    如果这样做的话,那成绩要怎么算呢?
    2014-03-28 22:36:49
    赞同 展开评论 打赏
  • 回2楼好了,是我的帖子
    所以说,中间或者结束前一周数据全换掉就可以一定程度避免调参大赛

    -------------------------

    回4楼时间流沙的帖子
    只能以更新数据后每组历来最高得分的排名为准了呗

    -------------------------

    回6楼holdybb的帖子
    人的特点不一样,就专门设置学习人的特点的算法,人为的一遍遍去试参,应付比赛还可以,真的面对上亿条数据时这种算法没有任何价值,更何况几亿条数据也不能叫多。

    -------------------------

    回7楼苍天破的帖子
    最后一句话自相矛盾了吧,得分有差距就不能叫具有普适性了。你要知道,如果某个算法仅仅对这是几万条数据有效,一换数据得分就降好几个百分点,那么这个算法没有任何价值,绝对不能称为是一个优秀的算法。

    -------------------------

    回12楼苍天破的帖子
    你没明白我所针对的问题,现在的情况导致了调参,而调参导致了前500中充斥大量用于调参的小号,这样的局面不利于比赛健康的发展下去,更不利于选出高质量的选手进入s2,最终影响比赛效果。我提出这个建议,是出于让比赛更好的回归其最初的意义。

    ps:或者说,调参试参不是不可以,但大量小号充斥其中是不大好的现象

    -------------------------

    回11楼duxingjinniu的帖子
    同意

    -------------------------

    回16楼苍天破的帖子
    减少比赛天数干嘛??减少排名次数就好了,不该一天一测。比赛天数不用减少毕竟这不是数学建模比赛,大家平时都挺忙减少天数没啥好处

    -------------------------

    回24楼好了,是我的帖子
    是个办法,还是静候阿里的措施吧,我还是比较信任他们

    -------------------------

    回27楼布布的帖子
    嗯嗯说的对!
    最近一直忙,前几天抽空随便写了个select语句提交上F在6%多名次在300左右,结果几天没弄现在已经跌出500了。。。
    2014-03-28 21:07:11
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    简直就是调参大赛,,看那个队名,,,前面有几个,严重怀疑是马甲,真不知道这些马甲到了复赛,会不会成为僵尸帐号。到时候,500个帐号,400个僵尸帐号,我倒是看看alibaba面子往哪里搁。

    最好成绩161.现在已经跌到300了。。。这个节奏,没几天就跌出500了。
    昨天改了一下模型,名次没升,反而降了好多。决定拿最好的成绩,开始调参。。。

    -------------------------

    Re可以在赛程过半的时候改一次数据
    最好成绩160多名,今天又从300多跌倒400多了。。。,这个节奏,明天就跌出前500了。
    前面的排名非常接近。差%0.01都差好几名。在数据量不是很大的情况下,很容易好的算法被剔除前500(包含n个小号,你懂的)。


    我还想进入S2,尝试一下我的算法在大树据下面的效果呢。。。看来没啥机会了。。。
    这两天在研究ODPS,看这个趋势,看来派不上什么用场。

    -------------------------

    Re可以在赛程过半的时候改一次数据
    巨数法则,大家都懂咯。。。500的S2名额,微弱的F1差距,N个马甲~

    -------------------------

    Re可以在赛程过半的时候改一次数据
    最好分之和?我觉得不妥,现在你看前面的分数多么接近,昨天我改了一下阀值,比对了下结果。就多了一条记录,F1提高了0.07%。这0.07%提高了几十名。

    对于小号的处理,我现在也没什么好想法。还是官方想办法吧。
    我觉得比较好的方法是,增加S1的样本数量。新样本包含旧样本的所有结果(闭包,你懂的)。
    每周增加10%,最后一周每天增加1%。
    首先,把一些比较挫的,要跑好几天的算法排除掉了。
    第二,如果大家不提交数据,以前数据仍然有效(闭包嘛)。
    第三,对手动调数据(不是调参,而是直接调数据)的人士,予以打击。
    2014-03-28 20:33:23
    赞同 展开评论 打赏
  • Re可以在赛程过半的时候改一次数据
    这是很好的建议!谢谢
    2014-03-28 19:15:17
    赞同 展开评论 打赏
滑动查看更多
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载