非基向量个人页面-阿里云开发者社区

个人头像照片 非基向量 TA的个人档案

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
  • 高分内容
  • 最新动态
  • 文章
  • 问答
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2014-04-22

    关于昨天群内有实验室多号测试融合数据事件(标题已改)

    Re关于昨天群内有实验室多号测试融合数据事件(标题已改)
    如果是真的,港科大队伍的融合和别的比赛如Netflix中所用到的ensemble learning有本质区别。

    简单说就是有没有private set的问题,Netflix和KDD Cup这么多届的比赛办下来,使用private set的一个原因就是防止这种情况发生。内部赛的时候没有这种情况发生,我觉得是各个小组分布在公司工位上,比赛是在一个封闭的空间里进行的,加上阿里的员工比较自律,都是按照玩数据第一,比赛第二的精神来的,所以一直没有出事。

    如果第二赛季还是没有private set的话,大家都不考虑泛化能力(@天猫_德福把这个叫做运气,但我觉得运气也有科学,而非玄学),那么多个队伍之间的串通(或者叫伪小号?)根本无解。就算安全团队出动,反作弊手段全上也没有办法。查相似度?本来总有人用近似的算法,相似也很合理。。。查log,查IP?本来就是不同团队分散提交的,怎么可能相同。。。

    事到如今,无非两种做法,一是期待参赛团队的自律精神(如我前面所说,我觉得这种对于反作弊的期待实在是太高了);二是改成private set的评测机制。我比较倾向于后者,并非不相信大家,而是因为,法立于上则俗成于下。

    之前老师不推荐我参加这个比赛,他觉得比赛的评测漏洞太多,事到如今,我玩着玩着停不下来了,才有点明白老师的意思。愿主办方三思。
    踩0 评论0
  • 回答了问题 2014-03-22

    我来发第一帖,总感觉这比赛不是真正意义的推荐算法比赛呢

    Re我来发第一帖,总感觉这比赛不是真正意义的推荐算法比赛呢
    比赛本来就是这样,如果说很完善的算法就能得到很好的结果,那这个比赛还有什么意义呢?就只比谁套用现成的算法更熟练?看谁调参的时候人品更好?而且CF和SVD做到3%还是很容易的,结合一些其他方法可以得到不错的效果。

    但是不得不吐槽,第三阶段的玩法完全不一样啊,前两阶段的意义何在?虽然我这种最多撑到第二轮的是无所谓啦。。。。
    踩0 评论0
  • 回答了问题 2014-03-19

    求今天演讲的PPT

    Re求今天演讲的PPT
    +1
    踩0 评论0
  • 回答了问题 2014-03-17

    大家说说都能预测出来多少用户

    Re大家说说都能预测出来多少用户
    lz你再好好数数。。。
    踩0 评论0
  • 回答了问题 2014-03-11

    有正确的预测结果数据吗

    Re有正确的预测结果数据吗
    可以把训练集分为两部分,用交叉验证的方法,不过我觉得一周一次,总共也就五六次的测试机会有点少了,第一轮只能求人品了~
    踩0 评论0
正在加载, 请稍后...
滑动查看更多