利用geopandas与PostGIS进行交互

本文涉及的产品
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: 利用geopandas与PostGIS进行交互

1 简介

PostGIS作为postgresql针对「地理空间数据」的拓展功能,可以帮助我们有效管理和固化空间矢量数据,以及开展空间数据分析,而geopandas作为Python生态中优秀的空间数据分析处理工具,自然在与PostGIS进行交互方面开发了相应的功能。

本文就将针对如何利用geopandasPostGIS空间数据库写入及读取矢量数据进行介绍。

图1

2 geopandas与PostGIS进行交互

为了能在geopandas中与postgresqlPostGIS建立连接,请确保以下3个库已经安装:

pip install sqlalchemy, psycopg2, geoalchemy2

接下来我们需要保证postgresql中存在可以连接的空间数据库,在「pgAdmin」界面内新建数据库,譬如这里我们新建数据库demo

图2 图3

点击保存成功创建数据库之后,要注意这时我们的demo数据库只是个普通的postgresql数据库,是不支持空间相关功能的,在对应数据库上右键打开查询工具:

图4

在弹出的界面中输入CREATE EXTENSION postgis;并执行,成功之后我们的数据库就变成了空间数据库,支持空间相关的各种功能:

图5

至此我们的准备工作就已结束,接下来我们就可以直接在geopandas中读写PostGIS数据表。

2.1 利用geopandas向PostGIS写入数据

为方便演示,这里我们以简化版的重庆市区县矢量面数据为例,首先我们导入所需的geopandas(注意geopandas版本必须大于等于0.8.0)与sqlalchemy(后者用于创建数据库连接),并读入重庆市.geojson文件,你可以在开头的Github仓库找到它:

图6

接着我们来演示如何通过geopandasPostGIS推送矢量信息表,使用到的API为to_postgis(),其主要参数如下:

「name」:字符型,用于指定推送到PostGIS后的表名称

「con」sqlalchemy.engine.Engine对象,用于建立与数据库的连接

「if_exists」:字符型,用于指定当数据库中已存在同名表时的相应策略,'fail'表示抛出错误,'replace'指替换,'append'指向原表追加,默认为fail

「schema」:字符型,用于指定schema,默认为'public'

「index」:bool型,用于指定是否保留index信息

「index_label」:字符型或序列,当「index」被设置为True时为index信息指定字段名称

首先需要利用sqlalchemy中的create_engine来创建数据库连接,传入字符串包含了「数据库类型」「用户名」「密码」「主机IP」「端口」以及「数据库名称」,格式为:

数据库类型://用户名:密码@主机IP:端口/数据库名称

对应本例:

图7

pgAdmin中随即就能查看到刚才写入的数据表:

图8 图9

2.2 利用geopandas从PostGIS读取数据

PostGIS中读取数据要用到另一个API,对应geopandasread_postgis(),其主要参数如下:

「sql」:字符型,对应从空间数据库中提取数据的SQL语句

「con」:同to_postgis()

「geom_col」:字符型,用于指定将哪一列作为GeoDataFrame的矢量列

「crs」:用于指定坐标参考系,同GeoDataFrame的坐标参考系设定方式

「index_col」:字符型或列表,用于指定将哪些列作为索引

「parse_dates」:列表,用于预解析时间类型数据

接着我们从PostGIS中读取刚才写入的表:

图10

简简单单,我们就实现了与PostGIS的交互。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
23天前
|
数据可视化 数据挖掘 定位技术
基于geopandas的空间数据分析—geoplot篇(上)
基于geopandas的空间数据分析—geoplot篇(上)
|
21天前
|
数据挖掘 定位技术 API
Python GIS神器geopandas 1.0版本来了
Python GIS神器geopandas 1.0版本来了
|
22天前
|
NoSQL 数据挖掘 定位技术
如何让geopandas支持写出gdb文件
如何让geopandas支持写出gdb文件
|
23天前
|
数据可视化 算法 数据挖掘
基于geopandas的空间数据分析-深入浅出分层设色
基于geopandas的空间数据分析-深入浅出分层设色
|
22天前
|
SQL Python
不只是快,详解geopandas新版文件读写
不只是快,详解geopandas新版文件读写
|
22天前
|
数据可视化 定位技术 Python
geopandas轻松绘制交互式在线地图
geopandas轻松绘制交互式在线地图
|
22天前
|
API Python
geopandas 0.9.0重要新特性一览
geopandas 0.9.0重要新特性一览
|
22天前
|
IDE 定位技术 开发工具
geopandas 0.11版本重要新特性一览
geopandas 0.11版本重要新特性一览
|
2月前
|
存储 数据可视化 数据处理
`geopandas`是一个开源项目,它为Python提供了地理空间数据处理的能力。它基于`pandas`库,并扩展了其对地理空间数据(如点、线、多边形等)的支持。`GeoDataFrame`是`geopandas`中的核心数据结构,它类似于`pandas`的`DataFrame`,但包含了一个额外的地理列(通常是`geometry`列),用于存储地理空间数据。
`geopandas`是一个开源项目,它为Python提供了地理空间数据处理的能力。它基于`pandas`库,并扩展了其对地理空间数据(如点、线、多边形等)的支持。`GeoDataFrame`是`geopandas`中的核心数据结构,它类似于`pandas`的`DataFrame`,但包含了一个额外的地理列(通常是`geometry`列),用于存储地理空间数据。
|
2月前
|
数据采集 数据挖掘 大数据
Pandas是Python数据分析的核心库,基于NumPy,提供DataFrame结构处理结构化数据
【7月更文挑战第5天】Pandas是Python数据分析的核心库,基于NumPy,提供DataFrame结构处理结构化数据。它支持缺失值处理(dropna()、fillna())、异常值检测(Z-Score、IQR法)和重复值管理(duplicated()、drop_duplicates())。此外,数据转换包括类型转换(astype())、数据标准化(Min-Max、Z-Score)以及类别编码(get_dummies())。这些功能使得Pandas成为大数据预处理的强大工具。
32 0