经过两个多月的激烈角逐,2018全球物联网数据创新大赛落下帷幕。这项比赛属于天池大数据竞赛的可视化大赛项目,有来自全世界636支队伍,1036名选手来参加比赛,最后决出了金银铜三个奖项和技术实力奖、最佳设计奖、媒体特别奖、商业潜质奖四个单项奖项。
其中来自众安科技的DVexplorer战队脱颖而出,获得总冠军。这个队伍有三名队员,参赛方案是垃圾车路径优化平台。
获奖项目展示
赛题和数据
赛题以“智慧城市”为主题,围绕飞凤平台应用开发、神经节应用开发、鸿山物联网小镇和慧海湾感知小镇实时数据分析,参赛选手,选题包括但不限于城市政务、旅游、产业、安居、环境,要求参赛队伍分析并深挖对城市各种公共数据之间的价值,并最终以可视化方式进行展示。
换句话说,题目开放,选题自由。
整个赛制分为初赛和复赛以及决赛,作品必须使用主办方提供的数据集中的至少一种,鼓励使用多种数据集。作品可以自由使用任意数据加工处理、分析挖掘和可视化工具。
整体来说,主办方提供了四个方向的数据,分别为城市功能区规划、分析、选址;企业帮扶和人才优化;天气情况、企业经营和环境治理关系分析;政府效率评估。
冠军团队所选择的方向为天气情况、企业经营和环境治理关系分析。其下的数据集有无锡市历史天气预报数据、无锡市公开数据、无锡市统计年鉴数据、 在线神经节数据等。在构建模型时,选手对多个数据集进行了加工处理。
关于数据质量,在接受大数据文摘采访时,冠军团队这样回答:“其他数据库并没有过多涉及。但清扫车部分提供了经纬度坐标、时间、车牌号、车速等多维度的信息,数据比较完整,并且数据库中GPS定位数据是实时变化的”。
所以,处理数据并不是项目需要攻克的难点,另外在采访中,冠军团队谈到:“目前对多车辆、存在容量限制的行车路径进行优化问题,仍较多停留在理论研究层面。将优化的结果进行可视化展示,并允许用户自定义场景,辅助用户决策,这一类的应用案例仍比较少见,这使我们在方案与算法的实现阶段遇到了挑战。”
垃圾车路径优化平台方案的目标是:在规定时间内。用最短的里程,完成清扫任务。
为了完成这一目标,采取了数据处理、拓扑网建模、数学建模、算法优化、可视化平台搭建等五个步骤。
数据处理
新吴区垃圾清运现状
数据处理分为三步,在这过程中使用了QGIS系统对路线进行了分析。
● 行驶路径提取● 重要节点提取
● 重要指标提取
第一步,行驶路径提取:使用组委会提供的车辆GPS数据,提取了车辆的行驶时间,经纬度坐标,以及车辆行驶的速度等等,绘制出11辆行驶路线图。
第二步,重要节点选取:经过严格的计算与分析,提取了两个重要的的节点,分别为环卫所,即开始与结束的停留点;垃圾场,即反复出入的点。
第三步,重要指标提取:进一步分析数据可以统计出所有车辆在一天内行驶296公里,清扫33个小时,75分钟装满垃圾并进行一次倾倒。
拓扑网建模
将得到的数据去绘制出清扫车经过路线图,得出共有117个主要的顶点和165条主要经过的道路,将117个点中最主要的39个车辆经常停靠的点定义为垃圾清扫的点,并且计算出每一个点垃圾清扫时所需要消耗的时间。
数学建模和算法优化
将目标优化函数设定为行驶里程最小值函数,并且设定了三个约束条件,第一个是限制所有车辆从环卫所出发并最后回到环卫所。第二个是限制每一个清扫点只能有一辆车进行清扫。第三个是限制车的装载量不能超过车的总容量。
经过这些数据的输入,比如说清扫点权重,清扫点耗时,清扫点的路径矩阵等等输入到算法中,运用遗传算法,设定总群个体数为80,并且进行算法的收敛,最终得出优化结果的数据。
可视化平台搭建
将优化结果的数据输入到可视化平台工具当中,并且最终完成了垃圾车路径优化平台的搭建。从结果来实现了在规定时间内用最短的里程完成清扫任务。以一个有10辆清扫车的站点为例,经过优化后垃圾车可以减少行驶17500公里,这将近要绕地球半圈,同时可以将站点一年的运营成本降低16%。
可以对于不同的条件进行方案的优化,比如说管理者要在规定时间内用最少车辆数进行任务的完成,比如想在早高峰8点之后完成任务,那输入不同的车辆,最终可以得到一个方案是:需要11辆车完成这样一个任务。
另外也可以帮助管理者去确定,在特定的时间,资源不足,任务又重的情况下如何去模拟一个方案。比如说大年初一这一天假设只有6辆车在值班,但是清扫点的垃圾会更多,通过我们的平台可以模拟出当天车队无法在8小时内完成这项工作,所以建议管理者额外调度一些车辆过来完成任务。
对于环境,平台可以有效减少车辆行驶时间,从而减少环境污染。
评委问答
Q:你们数据分析的方法为什么选用遗传算法,好处在哪里?跟别的算法相比有什么优点吗?
A:遗传算法是比较简单的,主要是分为有四步,初始值的确定,交叉算子,编译算子,得出最终结果比较简单。第二是可以拓展,这个算法可以很容易,只要变换数据,很容易扩展到其他模型当中。这个模型用得比较多的还有TS用得比较多,但是TS有一个问题,它对于初始值影响比较大,因为我们这是可交互的,如果初始值影响很大的话,每次交互结果会发生非常大的偏差,所以我们当时就没有选择那种算法,选择了遗传算法。
Q:优化目标函数是最短路径,为了节省运营成本,有没有考虑城市清洁效果?
A:清扫是到垃圾点装载垃圾的,而并不是清扫道路,这是根据提供数据分析出来的,只要在装载点把垃圾装到车上就可以达到我们的任务。
Q:简单介绍一下可视化平台的特点。
A:他是众安科技自己研发的可视化平台,最主要的功能是可以搭建数据大屏,但是也不仅仅局限于数据大屏,可以搭建这样一个比较简单的交互系统。
在这次搭建中相当于除了数据分析这一部分需要对数据进行处理以外,其他所有的结构都是不需要单独再去开发,直接使用平台就可以完成所有前端界面的搭建和交互的搭建实现的。
这个平台目前已经可以提供非常多图表的样式,包括简单的筛选,全局筛选等等的交互以及图表联动的交互模式。
本次大赛由无锡市新吴区人民政府和阿里云计算有限公司强强联合,从初赛到决赛一共历时2个多月。全球636支队伍,1036名选手参加了此次飞凤物联网大赛,其中国内选手占到84.8%,海外选手占到15.2%。他们的职业主要有科研机构的员工、公司员工和学生组成,这一次比赛也是打破了过往天池平台上高校学生占比的突破,公司员工参赛占到将近小一半的比例。
原文发布时间为:2018-09-25