[kaggle]DC比赛进程

简介: 数据量不算小,压缩包7个GPaste_Image.png估计今晚看不到了.png赛题分析:赛题分析.png敲黑板的重点:用于学习道路交通状况,以期对某时段下某出租车行驶某条线路所需的时间做出预测。
  • 数据量不算小,压缩包7个G


    Paste_Image.png
估计今晚看不到了.png

赛题分析:

赛题分析.png

敲黑板的重点:用于学习道路交通状况,以期对<big><big>某时段下某出租车行驶某条线路</big></big>所需的时间做出预测。
数据说明:
数据说明.png

数据总量:14亿条,7G压缩包
数据维度:1.4万辆出租车、08.03-08.30(28天数据)
预处理:清洗掉了其中重复的和异常的记录,并忽略了00:00:00~05:59:59这一时间段的数据。用于比赛的数据被划分为三个部分。
详情:
1.201408xx_train.txt:训练集出租车GPS数据。 从08月03日到23日之间的GPS记录,用于学习交通流的状况,属于“训练集”,包含10亿条记录信息。
2.predPaths_test.txt:用于预测的道路轨迹数据。待预测路线大约3万条,其数据格式与训练集类似,但分钟和秒被统一设置为0。为了避免通过统计“记录之间的时间间隔”来猜测时间,我们在每一条路径中,随机删除了一些点。为了识别方便,我们将每一条路径的数据按时间顺序写入文件,并加入路径id。
3.201408xx_train.txt:用于辅助识别轨迹对应的前一小时的GPS记录数据,数据格式同1)。在单位为小时的时间段上与2)无任何重叠。

附加说明.png
评分标准.png
3SH5LBO9`G$T3U{A21$L_DD.png

明天试着把下载好的数据demo放到亚马逊云的Rstudio里,考虑一下 大家手头能使用到的环境 和 擅长的分析环境,周末列一个初步的计划出来,本周的初步目标是:搭好运算环境、确定人员分工、读懂赛题说明、查阅参考资料。

对了,之前说的是纽约出租车的那个,大家可以到github上自行搜索:


Paste_Image.png
目录
相关文章
[kaggle]DC比赛进程3-参考资料
本次比赛可借鉴的比赛有: NYC taxi:因为数据开源NYC Open Data,所以网上有大量的研究。 ECML/PKDD 15: Taxi Trajectory Prediction KDD支持的在kaggle社区的比赛。
940 0
|
定位技术 API
[kaggle]DC比赛进程4
本次提交的个人观点: 对GIS的依赖程度 ,是否要接入postgresql进行GIS方面的计算(之前有一点点研究,并不深入); 关键的特征应该是trajectories轨迹方面的特征。
1063 0
|
分布式计算 算法
[kaggle]DC比赛进程2
周末公司计算系统崩了。也没想好用什么怎么进行数据处理。 周一和经理汇报工作时,得到了支持。适当可以申请,使用生产环境。 公司测试环境基本够用,180 vcores + 180G memory(一个任务30/30) 重新启用了之前的一个AWS的计算环境(1 vcores /1G memory/30G SSD)。
1159 0
|
5月前
BOSHIDA DC/AC电源模块的节能特点与环保优势
BOSHIDA DC/AC电源模块的节能特点与环保优势
BOSHIDA DC/AC电源模块的节能特点与环保优势
|
5月前
|
安全
DC/AC电源模块为现代电子设备提供稳定的能源
DC/AC电源模块为现代电子设备提供稳定的能源
 DC/AC电源模块为现代电子设备提供稳定的能源
|
5月前
|
安全
DC/AC电源模块:让电力转换变得更简单
DC/AC电源模块:让电力转换变得更简单
DC/AC电源模块:让电力转换变得更简单
|
6月前
DC/AC电源模块能够提供高效率和可靠性的能源转换
DC/AC电源模块能够提供高效率和可靠性的能源转换
DC/AC电源模块能够提供高效率和可靠性的能源转换
|
3月前
|
芯片 网络架构
开关电源DC-DC电源应用
DC-DC指直流转直流电源(Direct Current)。是一种在直流电路中将一个电压值的电能变为另一个电压值的电能的装置。如,通过一个转换器能将一个直流电压(5.0V)转换成其他的直流电压(1.5V或12.0V),我们称这个转换器为DC-DC转换器,或称之为开关电源或开关调整器。 DC-DC转换器一般由控制芯片,电感线圈,二极管,三极管,电容器构成。在讨论DC-DC转换器的性能时,如果单针对控制芯片,是不能判断其优劣的。其外围电路的元器件特性,和基板的布线方式等,能改变电源电路的性能,因此,应进行综合判断。 DC-DC转换器的使用有利于简化电源电路设计,缩短研制周期,实现最佳指标等,被
|
5月前
|
安全
BOSHIDA 使用DC/AC电源模块时需要注意的事项
BOSHIDA 使用DC/AC电源模块时需要注意的事项
BOSHIDA  使用DC/AC电源模块时需要注意的事项
|
5月前
|
安全
DC/AC电源模块在工业科技中重要的作用
DC/AC电源模块在工业科技中发挥着重要的作用
DC/AC电源模块在工业科技中重要的作用

相关实验场景

更多