全球ML建筑脚印
必应地图正在发布全球范围内的公开建筑脚印。我们从2014年至2021年的Bing地图图像中检测到777M的建筑,包括Maxar和Airbus的图像。为了完整起见,早期发布的数据集也包括在这个数据集中,并被纳入其中。你可以在这里找到Github repo和关于方法的更多信息。数据集是压缩的,可作为不同地区的GeoJSON和GeoJSONL文件。关于预处理的其他信息和一些更多的背景,可以在这里的博客上找到
免责声明:数据集的全部或部分描述是由作者或其作品提供的。
数据预处理
我将MSBuildings数据集纳入谷歌地球引擎,除了微软的7.77亿全球建筑足迹之外,还包括早期的版本,最终状态为10亿多足迹(1,069,059,359)。在整个摄取过程中,有一些有趣的性能行为。
有些数据集是以GeoJSON格式发布的,有些则是以大GeoJSON格式(GeoJSONL)发布的,虽然压缩后的大小足以限制硬件的类型,但解压缩后的提取物是大量的矢量文件。因此,需要对数据集进行分类和分割。
摄取时间在文件大小上不一定是线性的,似乎一个复杂的几何体需要更长的时间来摄取,尽管这并不是一个足够一致的概括。
极大的数据集被分割成较小的子集并被摄取。
摄取完成后,一个文件夹中的子集可以被合并、扁平化,并以不同程度的成功导出。
这里用到了一个函数:
ee.data.listAssets(parent, params, callback)
Returns a list of the contents in an asset collection or folder, in an object that includes an assets
array and an optional nextPageToken
.
Arguments:
parent (String):
The ID of the collection or folder to list.
params (api.ProjectsAssetsListAssetsNamedParameters, optional):
An object containing optional request parameters with the following possible values:
- pageSize (string) The number of results to return. Defaults to 1000.
- pageToken (string) The token for the page of results to return.
- filter (string) An additional filter query to apply. Example query:
properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type':'Point','coordinates':[0,0]}")
See AIP-160: Filtering for how to construct a query.
- view (string) Specifies how much detail is returned in the list. Either "FULL" (default) for all image properties or "BASIC".
callback (Function, optional):
If not supplied, the call is made synchronously.
Returns: api.ListAssetsResponse
ee.data.listAssets(parent ,参数,回调)
在包含资产数组和可选 nextPageToken 的对象中返回资产集合或文件夹中的内容列表。
参数:
parent(字符串):
要列出的集合或文件夹的 ID。
参数(api.ProjectsAssetsListAssetsNamedParameters,可选):
包含具有以下可能值的可选请求参数的对象:
pageSize(字符串)要返回的结果数。 默认为 1000。
pageToken(字符串)要返回的结果页面的标记。
filter (string) 要应用的附加过滤器查询。 示例查询:
properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type ':'Point','coordinates':[0,0]}") 请参阅 https://google.aip.dev/160 了解如何构建查询。
view(字符串)指定列表中返回的详细信息量。 所有图像属性的“FULL”(默认)或“BASIC”。
回调(函数,可选):
如果未提供,则同步进行调用。
返回:api.ListAssetsResponse
所有数据的展示形式
//所有数据的展示形式 var country = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/{country_name}'); //所有的数据列表 var ee_folder = ee.data.listAssets("projects/sat-io/open-datasets/MSBuildings"); //这里是澳大利亚和智利的建筑物提取 var australia = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia'); var chile = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Chile') //展示代码 var objects = ee.data.listAssets('projects/sat-io/open-datasets/MSBuildings') print('Assets in MS Global Buildings Footprint Folder', objects['assets']) print(ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia').size()) var feature = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia') Map.centerObject(feature.first(),6) Map.addLayer(feature.style({fillColor: '00000000',color: 'FF5500'})),{},'Australia'
License¶
The datasets are released under the Open Data Commons Open Database License.
Created by: Microsoft
Curated in GEE by: Samapriya Roy
Keywords: building footprint, machine learning, remote sensing, global
Last updated in GEE: 2022-05-30