开发者社区> 问答> 正文

benchmark程序

为帮助更多新参赛选手加入比赛,我们现提供一个简单的benchmark程序。
程序语言:python(numpy,pandas)
程序说明:读取user_pay表,统计customer_flow。根据最后一周的customer_flow,预测未来两周的结果。输出到prediction_example.csv
程序结果:0.1027

展开
收起
骞翮 2017-02-23 13:56:07 4936 0
5 条回答
写回答
取消 提交回答
  • Rebenchmark程序
    为什么我会出现这样的情况,楼主,求助
    2017-03-01 14:15:40
    赞同 展开评论 打赏
  • Rebenchmark程序
    下载不了啊,点击下载链接显示无法下载
    2017-02-24 13:54:45
    赞同 展开评论 打赏
  • Rebenchmark程序
    很好的做法
    2017-02-24 09:13:22
    赞同 展开评论 打赏
  • 如果发现提交后,loss和排名都是无,请按一下几条详细检查提交格式:
    1.  shop_id:shop_id应该为1至2000的整数值。缺少或异常的shop_id都会导致提交错误。可参考prediction_example.csv第一列。
    2. 预测结果:预测结果应是非负整数,而且不能为空
    3. 存储格式:最后请确认文件使用utf-8 without BOM格式存储。


    目前,大部分问题是第二条,请详细检查预测结果是否都是非负整数。

    如果依然无法解决,请将文件以附件方式发送至 tianchi_ijcai2017@service.alibaba.com,我们会尽快回复。

    -------------------------

    #coding=utf-8
    import numpy as np
    import pandas as pd

    # your path to table user_pay
    user_pay = 'user_pay.txt'

    # load data
    print('loading data...')
    user_pay_df = pd.read_table(user_pay, sep=',', header=None, \
        names=['user_id', 'shop_id', 'time_stamp'], \
        dtype={'user_id':'str', 'shop_id':'str', 'time_stamp':'str'})

    # generate customer flow
    print('generating customer flow...')
    user_pay_df['time_stamp'] = user_pay_df['time_stamp'].str[:10]
    customer_flow = user_pay_df.groupby(['shop_id', 'time_stamp']).size()
    # predict
    fid = open('prediction_example.csv', 'w')
    for shop_id in xrange(1, 2001):
        print('predicting: %4d/2000'%shop_id)
        weekly_flow = pd.Series(np.zeros(7, dtype=int),
            [d.strftime('%Y-%m-%d') for d in pd.date_range('10/25/2016', periods=7)])
        flow = customer_flow.loc[str(shop_id), '2016-10-25':'2016-10-31']
        weekly_flow[flow.index.get_level_values(1)] = flow
        # use latest week's customer flow to predict following 2 weeks' customer flow
        predictons = ','.join([str(x) for x in list(weekly_flow)*2])
        fid.write('%d,%s\n'%(shop_id, predictons))
    fid.close()
    print('Finish')


    2017-02-23 22:44:05
    赞同 展开评论 打赏
  • Rebenchmark程序
    楼主,我想问一下,我提交了两次数据,但都是显示没有结果,我看了一下自己的数据都符合要求,为什么没有结果呢?能帮我解决一下么
    2017-02-23 20:55:56
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载