12.19 数据集成应用
数据集成是指将众多的异构数据源进行有效地清洗、去冗、归并、匹配,且最终将融合后的数据形成统一视图的过程[17] 。时空众包可对时空数据进行有效集成。典型的时空数据集成需求包括地图数据集成、城市兴趣点 (Point of Interest,POI) 标注[18]等。以地图数据集成的为例,传统的地图数据集成主要通过测绘等手段完成,数据构建和维护成本均较高。Google 公司每年维护地图数据的花费高达 10亿美金。时空众包技术为地图数据集成提供了一种新思路,通常称为众包地图 (Crowdsourced Map)。开放街道地图 (Open Street Map,OSM) [19] 是众包地图应用的典型代表,可将其视为地图版的维基百科。OSM 通过招募志愿者 ( 众包参与者 ) 对地图进行编辑、标注,实现对地图数据的集成。在该应用中,平台同时也是时空众包任务发起者,任务为构建地图。志愿者们提供和维护世界各地关于道路、小道、咖啡馆、铁路车站等各种各样的数据,并使用航空图像、GPS 设备与传统的地区地图等来确保OSM 的精确性和时效性。截止至 2013 年,OSM 已经拥有超过 100 万注册用户,并收集了 2 100 万英里以上的道路数据和超过 7 800 万条建筑物数据。