im2608_个人页

个人头像照片 im2608
0
15
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 提交了问题 2017-10-19

    新人实战赛今天(2017-10-19)没有更新比赛成绩

  • 提交了问题 2016-10-13

    departure表中checking time 晚于flight time 可能不是脏数据

  • 提交了问题 2016-10-12

    airportgzflights表中,有些航班只有日期没有具体时间

  • 回答了问题 2016-10-12

    departure表中我发现有些数据 checking time 晚于 flight time

    Redeparture表中我发现有些数据 checking time 晚于 flight time
    前面官方已经回答了,可以按照脏数据来处理。

    不过也有人说是乘客乘坐完航班之后再出票是为了报销,不知实际情况如何。
    踩0 评论0
  • 回答了问题 2016-10-11

    departure表中关于航班起飞时间的疑问

    Redeparture表中关于航班起飞时间的疑问
    有没有可能是晚点,结果不断推迟起飞时间
    踩0 评论0
  • 提交了问题 2016-10-11

    departure表中我发现有些数据 checking time 晚于 flight time

  • 回答了问题 2016-08-31

    新人离线赛,线上和线下结果不一致,请问怎么找原因

    Re新人离线赛,线上和线下结果不一致,请问怎么找原因
    另外我想请问各位赛友,你们线下线上的结果是一致的吗

    -------------------------

    Re新人离线赛,线上和线下结果不一致,请问怎么找原因
    没有人理我  

    -------------------------

    Re新人离线赛,线上和线下结果不一致,请问怎么找原因
    ads1356, 我也是新手,指导谈不上,互相学习吧,你是怎么处理的?
    踩0 评论0
  • 提交了问题 2016-08-31

    新人离线赛,线上和线下结果不一致,请问怎么找原因

  • 提交了问题 2016-08-19

    请问新人离线赛今天(2016-08-19)怎么没有更新成绩

  • 回答了问题 2016-06-22

    请问新人离线赛为什么不更新成绩了?

    Re请问新人离线赛为什么不更新成绩了?
    我是在 (2016/06/22 08:03:20)这个时间提交的,但是一直没有更新
    踩0 评论0
  • 提交了问题 2016-06-22

    请问新人离线赛为什么不更新成绩了?

  • 提交了问题 2016-06-04

    请问离线赛的入口在哪里?

  • 回答了问题 2016-05-11

    离线赛掉到坑里实在爬不出来了, 恳请高手指点

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    感谢两位的回复,我再多试试。

    -------------------------

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    snowfrsh:
    我的环境是win7, win-python 3.4
    我现在的输出代码是这样的:
    outputFile = open(output_file_name, encoding="utf-8", mode='w')
    outputFile.write("\"user_id\",\"item_id\"\n")  # 文件头, 添加  \n 来换行
    for index in range(len(predicted_prob)):
                if (predicted_prob[index][1] >= min_proba):
                    outputFile.write("\"%s\",\"%s\"\n" % (samples_test[index][0], samples_test[index][1])) # 预测结果,添加  \n 来换行

    outputFile.close()

    我尝试使用以下的代码,但出错:
            outputFile = open(output_file_name, mode='wb')  # 二进制打开
            outputFileWriter = csv.writer(outputFile)
            outputFileWriter.writerow(["user_id", "item_id"])  # 这里出错, 走不下去了 TypeError: 'str' does not support the buffer interface, 我没有找到解决方法
            for index in range(len(predicted_prob)):
                if (predicted_prob[index][1] >= min_proba):
                    outputFileWriter.writerow([samples_test[index], samples_test[index]])

    -------------------------

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    snowfrsh,
    很不幸,还是 0, 但是代码里有个bug,所以我不确认到底是哪里导致的问题,改完bug我再试试看

    -------------------------

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    zhan建州
    感谢你的回复,我没用过np.savetxt()这个函数,今天就试试看。多谢

    -------------------------

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    zhan建州, snowfrsh
    感谢之前的回复,今天有结果了,但是成绩很差,f1 只有百分之零点几, 说明提交格式起码是正确的。
    至于成绩为什么会这么差,我想先从采样方式入手。 我是根据某个use否在某一天购买了某个item作为一个正样本,例如为12-19号做预测,那么用户在12-18号的购买记录则作为正样本,但只是采用12-18这一天的购买记录还是再加上之前若干天的购买记录作为正样本,这个我不确认,能否给些建议。
    另外负样本,我现在的是根据item的热度来采样,我用这个公式来计算热度:
    item_popularity = item_view_cnt*0.01 + item_favourite_cnt*0.33 + item_cart_cnt*0.47 + item_buy_cnt*0.94, 这些系数我只是简单的统计了一下每个行为之间的比例后得到的。
    得到热度之后,就根据热度来采样,热度越高的item就越容易被采集到负样本中。但这样只是考虑了item,是不是还要考虑 user的因素,因为毕竟一个样本是一个 <user, item> pair。
    还有就是采样的时候我没有考虑特征,是否根据特征来分层采样会更好?
    另外我发现如果只在商品子集中采样正负样本会显著增加准确率,但如果这样的的话是否会丢掉某些模式?

    这是我现在的问题,望能不吝赐教。

    -------------------------

    Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
    非常非常感谢zhan建州提供的信息,我会仔细看的。

    非常感谢
    踩0 评论0
  • 提交了问题 2016-05-11

    离线赛掉到坑里实在爬不出来了, 恳请高手指点

  • 提交了问题 2016-05-05

    请问新人实战赛为什么不刷新成绩了?

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息