全球谷歌-微软开放式建筑数据集
该数据集整合了谷歌 V3 开放式建筑和微软最新的建筑足迹,包含 2,534,595,270 个惊人的足迹。截至 2023 年 9 月,它已成为最全面的开放式数据集。该数据集涵盖 92% 的 0 级行政边界,分为 182 个分区。每个足迹都明确标注了其来源,指出是来自谷歌还是微软。该数据集可以 GeoParquet、FlatGeobuf 和 PMTiles 等云原生地理空间格式访问,为各种应用提供了强大的资源。更多详细信息,包括该数据集的综合信息和方法,可分别在此处和此处查看。Source Cooperative
数据集模式
采用国家级数据集,数据集中的每一行都提供了特定建筑占地面积的信息,并在各个列上提供了相关信息前言 – 人工智能教程
该数据集合并了谷歌的 V3 开放式建筑和微软的最新建筑足迹。据我们所知,截至 2023 年 9 月,该数据集拥有 2,534,595,270 个足迹,是最完整的公开数据集。它覆盖了 92% 的 0 级行政边界,并分为 182 个分区。每个足迹都标注了各自的来源(谷歌或微软)。可通过云原生地理空间格式(如 GeoParquet、FlatGeobuf 和 PMTiles)访问该数据集。
谷歌
原始的 Google V3 开放式建筑可从此链接以压缩 CSV 文件的形式下载。以下是有关原始数据集的一些关键细节:
该数据集包含 18 亿个建筑物检测数据,覆盖非洲、南亚、东南亚、拉丁美洲和加勒比海地区 5800 万平方公里的推断区域。
数据集中的每栋建筑都有一个多边形,定义了其在地面上的足迹,一个置信度分值表示我们对这是一栋建筑的确定程度,以及一个与建筑中心相对应的加号代码。除了建筑物的几何形状之外,没有关于建筑物类型、街道地址或其他任何细节的信息。
微软
微软建筑足迹的最新版本可以 gzip 压缩分区文件的形式从微软 Planetary Computer 下载。
微软全球开放式建筑数据集是通过必应地图生成的,必应地图共检测到 12.4 亿栋建筑。这些建筑是利用必应地图的图像识别的,其中包括从 2014 年到 2023 年收集的数据,包括来自 Maxar、空中客车和法国 IGN 的图像。
boundary_id(INTEGER):将 CGAZ 0 级边界 ISO 连接到整数的唯一 ID,用于在 BigQuery 中对数据集进行分区。
置信度(FLOAT):表示模型对建筑足迹准确性的信心度量。由于原始数据集没有此属性,因此微软提供的足迹将此列设置为空。
bf_source (字符串):表示足迹的来源--谷歌或微软。
area_in_meters (FLOAT):表示多边形的面积,单位为平方米。
Dataset Citation¶
Please cite the original citations from source dataset including date of access of the combined dataset for citation here is a sample citation
Google-Microsoft Open Buildings - combined by VIDA, https://beta.source.coop/repositories/vida/google-microsoft-open-buildings. Date Accessed: [Insert the date you accessed the webpage in the format YYYY-MM-DD]
Earth Engine Snippet¶
这些数据集是从国家级的 geoparquet 文件中收集的,下文仅提及其中的一个子集,而一个 earthengine ls 应能提供所有国家的更多信息。所有特征集合的格式为
projects/sat-io/open-datasets/VIDA_COMBINED/"3 letter country ISO code"
for example India would be
var ind = ee.FeatureCollection("projects/sat-io/open-datasets/VIDA_COMBINED/IND") Map.setCenter(79.088,21.145,14) Map.addLayer( ee.FeatureCollection(ind).style({ fillColor: '00000000', color: '#964B00', }),{},'Combined Buildings India' );
Earth Engine App: global-buildings
License¶
The data is shared under the Creative Commons Attribution (CC BY-4.0) license and the Open Data Commons Open Database License (ODbL) v1.0 license. As the user, you can pick which of the two licenses you prefer and use the data under the terms of that license.
Contact information: VIDA has provided contact information and if you'd like more information about the dataset or the processing steps, feel free to write an email to darell@vida.place.
Provided by: VIDA, Google, Microsoft
Curated in GEE by: Samapriya Roy
Last updated in GEE: 2023-11-28