离线赛掉到坑里实在爬不出来了, 恳请高手指点
Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
准确率一直是0,觉得应该是格式的问题,一个笨的方法(我现在用的就是这种):你可以用notepad++打开csv文件,看看编码方式是不是UTF-8,还有第一行数据格式是不是:“user_id','item_id'(一定要有双引号)
-------------------------
Re离线赛掉到坑里实在爬不出来了, 恳请高手指点
我用的土方法,你先将你的结果矩阵(如testPredict)保存随便保存成csv格式(txt格式),我是用python的np.savetxt('testPredict.csv',testPredict,dilimiter=',')语句,然后在”赛题与数据“一栏中下载选手结果数据样例.csv,用notepad++打开选手结果数据样例.csv及testPredict.csv,将testPredict.csv中的数据复制到选手结果数据样例.csv,保存,文件重命名为tianchi_mobile_recommendation_predict.csv,OK,搞定。
-------------------------
回 12楼imagery608的帖子
我的建议是你先看一下去年的几个大牛是怎么做的,网上有他们的答辩PPT,如http://wenku.baidu.com/link?url=MrScWbcz1WV5R0ICkT-cesgs9C8Inv2Wscf2HV52aqcwhR9FzBV55q0BJshCaGJJDCUt4pk61eTflSnMXI_F9mjdIA-lsmRLW79ZbYtvTka, 你可以结合他们的思路来做(对我而言,他们的PPT中的信息量真的是超大的,尤其是特征工程那一部分),这样可以少走很多弯路。
赞0
踩0