Google Earth Engine(GEE)——全球建筑物数据集(MSBuildings数据集)包含微软7.77忆建筑物

简介: Google Earth Engine(GEE)——全球建筑物数据集(MSBuildings数据集)包含微软7.77忆建筑物

全球ML建筑脚印

必应地图正在发布全球范围内的公开建筑脚印。我们从2014年至2021年的Bing地图图像中检测到777M的建筑,包括Maxar和Airbus的图像。为了完整起见,早期发布的数据集也包括在这个数据集中,并被纳入其中。你可以在这里找到Github repo和关于方法的更多信息。数据集是压缩的,可作为不同地区的GeoJSON和GeoJSONL文件。关于预处理的其他信息和一些更多的背景,可以在这里的博客上找到

免责声明:数据集的全部或部分描述是由作者或其作品提供的。

数据预处理

我将MSBuildings数据集纳入谷歌地球引擎,除了微软的7.77亿全球建筑足迹之外,还包括早期的版本,最终状态为10亿多足迹(1,069,059,359)。在整个摄取过程中,有一些有趣的性能行为。

有些数据集是以GeoJSON格式发布的,有些则是以大GeoJSON格式(GeoJSONL)发布的,虽然压缩后的大小足以限制硬件的类型,但解压缩后的提取物是大量的矢量文件。因此,需要对数据集进行分类和分割。

摄取时间在文件大小上不一定是线性的,似乎一个复杂的几何体需要更长的时间来摄取,尽管这并不是一个足够一致的概括。

极大的数据集被分割成较小的子集并被摄取。

摄取完成后,一个文件夹中的子集可以被合并、扁平化,并以不同程度的成功导出。

这里用到了一个函数:

ee.data.listAssets(parent, params, callback)

Returns a list of the contents in an asset collection or folder, in an object that includes an assets array and an optional nextPageToken.

Arguments:

parent (String):

The ID of the collection or folder to list.

params (api.ProjectsAssetsListAssetsNamedParameters, optional):

An object containing optional request parameters with the following possible values:

  • pageSize (string) The number of results to return. Defaults to 1000.
  • pageToken (string) The token for the page of results to return.
  • filter (string) An additional filter query to apply. Example query:

properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type':'Point','coordinates':[0,0]}") See AIP-160: Filtering for how to construct a query.

  • view (string) Specifies how much detail is returned in the list. Either "FULL" (default) for all image properties or "BASIC".

callback (Function, optional):

If not supplied, the call is made synchronously.

Returns: api.ListAssetsResponse

ee.data.listAssets(parent ,参数,回调)

在包含资产数组和可选 nextPageToken 的对象中返回资产集合或文件夹中的内容列表。

参数:

parent(字符串):

要列出的集合或文件夹的 ID。

参数(api.ProjectsAssetsListAssetsNamedParameters,可选):

包含具有以下可能值的可选请求参数的对象:

pageSize(字符串)要返回的结果数。 默认为 1000。

pageToken(字符串)要返回的结果页面的标记。

filter (string) 要应用的附加过滤器查询。 示例查询:

properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type ':'Point','coordinates':[0,0]}") 请参阅 https://google.aip.dev/160 了解如何构建查询。

view(字符串)指定列表中返回的详细信息量。 所有图像属性的“FULL”(默认)或“BASIC”。

回调(函数,可选):

如果未提供,则同步进行调用。

返回:api.ListAssetsResponse

所有数据的展示形式

//所有数据的展示形式
var country  = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/{country_name}');
//所有的数据列表
var ee_folder = ee.data.listAssets("projects/sat-io/open-datasets/MSBuildings");
//这里是澳大利亚和智利的建筑物提取
var australia = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia');
var chile = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Chile')
//展示代码
var objects = ee.data.listAssets('projects/sat-io/open-datasets/MSBuildings')
print('Assets in MS Global Buildings Footprint Folder', objects['assets'])
print(ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia').size())
var feature = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia')
Map.centerObject(feature.first(),6)
Map.addLayer(feature.style({fillColor: '00000000',color: 'FF5500'})),{},'Australia'

 

License

The datasets are released under the Open Data Commons Open Database License.

Created by: Microsoft

Curated in GEE by: Samapriya Roy

Keywords: building footprint, machine learning, remote sensing, global

Last updated in GEE: 2022-05-30

 

相关文章
|
7月前
|
数据可视化 定位技术 Sentinel
如何用Google Earth Engine快速、大量下载遥感影像数据?
【2月更文挑战第9天】本文介绍在谷歌地球引擎(Google Earth Engine,GEE)中,批量下载指定时间范围、空间范围的遥感影像数据(包括Landsat、Sentinel等)的方法~
2646 1
如何用Google Earth Engine快速、大量下载遥感影像数据?
|
7月前
|
存储 编解码 数据可视化
Google Earth Engine获取随机抽样点并均匀分布在栅格的不同数值区中
【2月更文挑战第14天】本文介绍在谷歌地球引擎(Google Earth Engine,GEE)中,按照给定的地表分类数据,对每一种不同的地物类型,分别加以全球范围内随机抽样点自动批量选取的方法~
636 1
Google Earth Engine获取随机抽样点并均匀分布在栅格的不同数值区中
|
7月前
|
API Go 网络架构
GEE Colab——如何从本地/Google云盘/Google Cloud Storage (GCS)上传和下载
GEE Colab——如何从本地/Google云盘/Google Cloud Storage (GCS)上传和下载
356 4
|
7月前
|
机器学习/深度学习 存储 人工智能
GEE Colab——初学者福音快速入门 Google Colab(Colaboratory)
GEE Colab——初学者福音快速入门 Google Colab(Colaboratory)
250 3
|
7月前
|
编解码 人工智能 算法
Google Earth Engine——促进森林温室气体报告的全球时间序列数据集
Google Earth Engine——促进森林温室气体报告的全球时间序列数据集
96 0
|
7月前
|
编解码 人工智能 数据库
Google Earth Engine(GEE)——全球道路盘查项目全球道路数据库
Google Earth Engine(GEE)——全球道路盘查项目全球道路数据库
159 0
|
7月前
|
编解码
Open Google Earth Engine(OEEL)——matrixUnit(...)中产生常量影像
Open Google Earth Engine(OEEL)——matrixUnit(...)中产生常量影像
81 0
|
7月前
Google Earth Engine(GEE)——导出指定区域的河流和流域范围
Google Earth Engine(GEE)——导出指定区域的河流和流域范围
286 0
|
7月前
|
传感器 编解码 数据处理
Open Google Earth Engine(OEEL)——哨兵1号数据的黑边去除功能附链接和代码
Open Google Earth Engine(OEEL)——哨兵1号数据的黑边去除功能附链接和代码
143 0
|
7月前
Google Earth Engine(GEE)——当加载图表的时候出现错误No features contain non-null values of “system:time_start“.
Google Earth Engine(GEE)——当加载图表的时候出现错误No features contain non-null values of “system:time_start“.
133 0