datafan_个人页

个人头像照片 datafan
0
17
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2014-04-13

    能否适当的放宽名额

    回2楼苍天破的帖子
    别这么说,官方已经改过一次了~~~
    踩0 评论0
  • 回答了问题 2014-04-06

    大家都有什么好的调参技巧

    Re大家都有什么好的调参技巧
    负样本再抽样 样本就太少了
    可以看看SMOTE这种抽样
    评价的话 直接用F1 不要再看准确率了
    还有,我记得rf也可以输出概率的话,可以多试试几个cutoff,不一定是0.5的地方。
    这个加入了时间因素,貌似没法做cv,慢慢调吧

    -------------------------

    Re大家都有什么好的调参技巧
    == 貌似说错了, 用时间惩罚后的分类样本,可以做CV,就是数据少了点
    踩0 评论0
  • 回答了问题 2014-03-31

    第一赛季结果评审建议

    Re第一赛季结果评审建议
    说真的,我从一开始就不支持一天一侧。
    问题就是因为怕小号更多(比如我一个号推3000个 一个号推4000个 再改改参数,能查出来?)
    当然,一周一测的确是太少了,2-3次(比如周三周六周日)相对比较合适。
    另外,至于过度调参的问题。可以参考kaggle的做法。设置一个public排行榜还有一个private排行榜。public只取部分结果作为检查,private是取全部。而比赛结束前,我们只能看到public的排行榜,最后名次按private定
    踩0 评论0
  • 回答了问题 2014-03-28

    可以在赛程过半的时候改一次数据

    Re可以在赛程过半的时候改一次数据
    几天前就说了,调参大赛而已~呵呵
    踩0 评论0
  • 回答了问题 2014-03-26

    貌似一天一测了?

    回3楼test010的帖子
    我酸什么== 我也是每天一次啊。。。

    -------------------------

    回1楼淡缕凝风的帖子
    ==其实就吐槽下,没意思,哈哈

    -------------------------

    回2楼ww54070121的帖子
    已经一天一次了~~~通知也没看到,排行榜在变
    踩0 评论0
  • 提交了问题 2014-03-26

    貌似一天一测了?

  • 回答了问题 2014-03-25

    大家的算法一般要运行多久才出结果啊?快两天了,我的不会死循环了吧

    Re大家的算法一般要运行多久才出结果啊?快两天了,我的不会死循环了
    肯定是程序写的太差==
    踩0 评论0
  • 回答了问题 2014-03-24

    阿里大数据竞赛非官方指南第二弹

    Re阿里大数据竞赛非官方指南第二弹
    赞楼主
    踩0 评论0
  • 回答了问题 2014-03-24

    【求助】我把截止时间弄错了,周日中午才提交

    Re【求助】我把截止时间弄错了,今天中午才提交
    本地测试呗=、=

    -------------------------

    回3楼时间流沙的帖子
    本地还是挺准的,至少我是这样,出入不大。

    -------------------------

    Re【求助】我把截止时间弄错了,今天中午才提交
    打个比方,你现在本地能到6.
    然后这周你调整到了8或者9以上,那么就是进步~~~
    本地能上10,我相信线上7是很容易的(规则不是太复杂的话)
    给你参考,我本地8,线上6.5+

    -------------------------

    回9楼偶也的帖子
    是的。我用前2个月预测第三个月,用前三个月预测第四个月
    2个f1肯定不一样,但差的不多,表示可以接受

    -------------------------

    回13楼偶也的帖子
    线上低1.5%+
    预期之内,我参数调一下 说不定就上去了
    踩0 评论0
  • 回答了问题 2014-03-24

    防作弊又何须每周评测一次

    Re防作弊又何须每周评测一次
    说真的,每天一次或多次,刷的会更狠。
    你想啊,随便换个参数,就能交一次,没有太多的算法成本
    踩0 评论0
  • 回答了问题 2014-03-23

    提供更多的评测机会

    Re提供更多的评测机会
    我觉得改为1周2次比较合适
    每天一侧肯定不行,这么点数据,随便猜猜,小号猜的更狠了
    踩0 评论0
  • 回答了问题 2014-03-23

    掉了掉了!

    Re掉了掉了!
    楼主还需努力探索数据啊!加油加油
    踩0 评论0
  • 回答了问题 2014-03-21

    最终结果10%应该是能进season2的水平

    Re最终结果10%应该是能进season2的水平
    本地容易overfit。。。如果自己设计模型的话,参数变化很大
    踩0 评论0
  • 回答了问题 2014-03-19

    关于购买行为数量

    Re关于购买行为数量
    前四个月有7000左右的购买吧
    不过确实第九个月有3000次+  也不科学啊
    踩0 评论0
  • 回答了问题 2014-03-19

    结果不会出现新的用户。那旧用户购买新的商品呢?

    Re结果不会出现新的用户。那旧用户购买新的商品呢?
    有你能预测出来?

    -------------------------

    回3楼test010的帖子
    这个怎么考虑呢== 又预测不到 谁买了新商品

    -------------------------

    回5楼test010的帖子
    我觉得不用考虑,而且其实这个关系真的不大,因为肯定会overfitting
    但是一定要确定的话,新商品不会出现,是指前3个月也没有的商品
    但是顾客 肯定会买他前三个月没有过行为的商品(该商品前三个月 有别的顾客有过行为)
    踩0 评论0
  • 回答了问题 2014-03-13

    算法的普遍性与精确性成反比的。。我想说

    Re算法的普遍性与精确性成反比的。。我想说
    楼主的意思是指万能的算法 一般对具体问题 并不是最好的解决办法么
    踩0 评论0
  • 回答了问题 2014-03-13

    有一些问题

    Re有一些问题
    你去linux下打开demo看看

    -------------------------

    回5楼duxingjinniu的帖子
    我用readline读进来就一行~~~
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息