《Python地理数据处理》——1.4 探究数据

简介:

本节书摘来自异步社区《Python地理数据处理》一书中的第1章,第1.4节,作者: 【美】Chris Garrard(加勒德) 更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.4 探究数据

使用Python的过程中会看到多种可视化数据的方法,但探究数据最好的方法仍然是使用桌面端的GIS程序。在桌面程序中,你可以轻松地对空间数据进行可视化,并查看数据的属性信息。如果你目前还没有安装GIS软件,开源GIS软件里的QGIS是一个很好的选择,而且在本书中需要的地方将会被用到。

可下载的代码和样例数据

本书例子中涉及的代码和样例数据都可以通过下面的链接地址下载获得。如果想边学边练,需要下载这些内容。

代码包含本书中的实例和所用到的个人设置,实例中用到的所有数据都包含在内。

代码:https://github.com/cgarrard/osgeopy-code和www.manning.com/books/geoprocessing-with-python。
数据:https://app.box.com/osgeopy和www.manning.com/books/geoprocessing-with-python。

这不是一本关于QGIS的书籍,所以我不会太多地介绍如何使用它。在网站上有相应的文档资料,你也可以找到此主题相关的图书。不过,我将要简单地讲述如何使用QGIS加载数据进行查看。如果你之前从未使用过GIS,初次打开QGIS时,可能会被吓住。不过,使用它查看数据一点也不难。

例如,要加载本书实例数据的一个Shapefile文件,从QGIS图层菜单中选择Add vector layer。在打开的对话框中,确保File选项被选中,然后单击Browse按钮选择一个shapefile文件。可以选择US文件夹下的countyp010.shp文件开始(见图1.7)。



选择文件后,在Add vector layer对话框中单击Open按钮,选择的矢量空间数据就绘制显示在QGIS中,如图1.8所示。你可以使用放大镜工具(见图1.8中圈出的功能)放大查看地图的一部分。



可以在左侧的图层列表中查看到图层的名字,这个例子中,图层的名字为countyp010。在图层上双击会弹出属性对话框,单击样式选项卡,可以对图层绘制显示的样式进行修改。让我们修改一下各县图层,不要所有的郡县都显示同一种颜色,而是根据其所在的州显示不同的颜色。要实现这种效果,可以从下拉框中选择Categorized,在column参数中选择STATE,在Color ramp下拉框中选择一种色带,然后单击Classify按钮。你可以看到所有的州以及它们对应的颜色,如图1.9所示。你也可以从列表中选择一个新的色带来改变现有显示的颜色,单击Delete All按钮,然后再次单击Classify按钮即可。你还可以通过双击列表中邻近州名缩写的色块,来改变某个具体州的显示颜色。



纸质书籍读者注意,关于彩色图像:

在本书中,许多图像以彩色显示的效果最好。电子书版本是以彩色图像进行显示的,所以阅读本书时需要提及一下此电子书。想获得PDF、ePub以及Kindle格式的电子书 with-python注册你的纸质图书编号。
一旦对设置的颜色满意了,可以单击Apply按钮,所设置的颜色将会应用在QGIS的主视图中(见图1.10)。



可以查看空间数据附带的属性数据,在图层名字上右键选择Open Attribute Table,图1.11中所显示的表格中每一行对应地图中所显示的一个郡县。其实,可以试着单击最左侧一列的数字来选择一行,然后单击Zoom map to selected rows按钮(即图1.11中圈出的按钮),看看会发生什么。



熟悉QGIS并且至少要阅读网站中所提供的部分文档。这款软件功能非常强大,值得学习。关于它的使用,我将贯穿全书,但是对软件的讲解不会面面俱到。然而,使用它可以查看样例数据或者已经创建的任何数据结果。

相关文章
|
2月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
292 10
|
4天前
|
数据采集 数据安全/隐私保护 Python
从零开始:用Python爬取网站的汽车品牌和价格数据
在现代化办公室中,工程师小李和产品经理小张讨论如何获取懂车帝网站的汽车品牌和价格数据。小李提出使用Python编写爬虫,并通过亿牛云爬虫代理避免被封禁。代码实现包括设置代理、请求头、解析网页内容、多线程爬取等步骤,确保高效且稳定地抓取数据。小张表示理解并准备按照指导操作。
从零开始:用Python爬取网站的汽车品牌和价格数据
|
1月前
|
数据采集 Web App开发 数据可视化
Python用代理IP获取抖音电商达人主播数据
在当今数字化时代,电商直播成为重要的销售模式,抖音电商汇聚了众多达人主播。了解这些主播的数据对于品牌和商家至关重要。然而,直接从平台获取数据并非易事。本文介绍如何使用Python和代理IP高效抓取抖音电商达人主播的关键数据,包括主播昵称、ID、直播间链接、观看人数、点赞数和商品列表等。通过环境准备、代码实战及数据处理与可视化,最终实现定时任务自动化抓取,为企业决策提供有力支持。
|
1月前
|
SQL 分布式计算 数据处理
云产品评测|分布式Python计算服务MaxFrame | 在本地环境中使用MaxFrame + 基于MaxFrame实现大语言模型数据处理
本文基于官方文档,介绍了由浅入深的两个部分实操测试,包括在本地环境中使用MaxFrame & 基于MaxFrame实现大语言模型数据处理,对步骤有详细说明。体验下来对MaxCompute的感受是很不错的,值得尝试并使用!
48 1
|
1月前
|
人工智能 分布式计算 数据处理
有奖评测,基于分布式 Python 计算服务 MaxFrame 进行数据处理
阿里云MaxCompute MaxFrame推出分布式Python计算服务MaxFrame评测活动,助力开发者高效完成大规模数据处理、可视化探索及ML/AI开发。活动时间为2024年12月17日至2025年1月31日,参与者需体验MaxFrame并发布评测文章,有机会赢取精美礼品。
|
2月前
|
数据采集 Web App开发 监控
Python爬虫:爱奇艺榜单数据的实时监控
Python爬虫:爱奇艺榜单数据的实时监控
|
2月前
|
数据采集 分布式计算 大数据
构建高效的数据管道:使用Python进行ETL任务
在数据驱动的世界中,高效地处理和移动数据是至关重要的。本文将引导你通过一个实际的Python ETL(提取、转换、加载)项目,从概念到实现。我们将探索如何设计一个灵活且可扩展的数据管道,确保数据的准确性和完整性。无论你是数据工程师、分析师还是任何对数据处理感兴趣的人,这篇文章都将成为你工具箱中的宝贵资源。
|
2月前
|
数据采集 存储 XML
python实战——使用代理IP批量获取手机类电商数据
本文介绍了如何使用代理IP批量获取华为荣耀Magic7 Pro手机在电商网站的商品数据,包括名称、价格、销量和用户评价等。通过Python实现自动化采集,并存储到本地文件中。使用青果网络的代理IP服务,可以提高数据采集的安全性和效率,确保数据的多样性和准确性。文中详细描述了准备工作、API鉴权、代理授权及获取接口的过程,并提供了代码示例,帮助读者快速上手。手机数据来源为京东(item.jd.com),代理IP资源来自青果网络(qg.net)。
|
3月前
|
数据采集 存储 数据处理
Python中的多线程编程及其在数据处理中的应用
本文深入探讨了Python中多线程编程的概念、原理和实现方法,并详细介绍了其在数据处理领域的应用。通过对比单线程与多线程的性能差异,展示了多线程编程在提升程序运行效率方面的显著优势。文章还提供了实际案例,帮助读者更好地理解和掌握多线程编程技术。
|
3月前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
213 19

热门文章

最新文章