【python】python天气气候数据抓取分析可视化(源码+数据+可视化+报告)【独一无二】

本文涉及的产品
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
简介: 【python】python天气气候数据抓取分析可视化(源码+数据+可视化+报告)【独一无二】

一、网页分析

爬取2345天气王网页的数据,进行数据分析可视化:


主要爬取了,主要包含日期、最高气温、最低气温、天气、风力风向等数据信息。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


这段Python代码主要用于从网站上抓取历史天气数据并保存到本地的CSV文件中。下面逐块解释每部分代码的功能:


导入模块

import re
import csv
import requests


  • re: 用于处理正则表达式,这在解析网页内容时非常有用。
  • csv: 用于读写CSV文件,这里主要用于保存抓取的数据。
  • requests: 用于发起网络请求,获取网页数据。


初始化CSV文件

with open('weather_data.csv', 'a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['日期', '最高温', '最低温', '天气', '风力风向'])
    file.close()


  • 这部分代码打开(或创建)一个名为weather_data.csv的文件,并设置为追加模式('a')。
  • 用csv.writer创建一个CSV写入器,然后写入表头,包括日期、最高温、最低温、天气和风力风向。
  • 文件使用UTF-8编码,以支持中文字符。
  • newline=''用于防止在写入行之间产生额外的空行。


爬取数据

for i in range(2011, 2025):
    for j in range(1, 13):
        url = f"https://tiaxxxx.com"


  • 使用双层循环遍历从2011年到2023年的每个月。
  • 构造URL以根据年份和月份请求对应的历史天气数据。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


设置请求头

headers = { ... }


  • headers字典包含了众多HTTP头部信息,这些信息用于模拟浏览器请求,避免被服务器识别为爬虫。


发送请求并解析数据

res = requests.get(url=url, headers=headers)
text = res.json()['data'].replace('\n', '').replace(' ', '')


  • 使用requests.get向构造的URL发送请求,传入之前设置的headers。
  • 从响应中提取JSON格式的数据,并进一步获取其中的data字段。然后移除响应中的换行符和空格,方便后续的数据处理。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


正则表达式解析

if i <= 2015:
    pattern = r'<tr><td>(.*?)</td><tdstyle="[^>]*">(.*?)</td><tdstyle="[^>]*">(.*?)</td><td>(.*?)</td><td>(.*?)</td>'
else:
    pattern = r'<tr><td>(.*?)</td><tdstyle="[^>]*">(.*?)</td><tdstyle="[^>]*">(.*?)</td><td>(.*?)</td><td>(.*?)</td>'


  • 根据不同的年份选择不同的正则表达式模式。尽管这里两个模式看起来一样,实际使用中可能有微小的差别。
  • 正则表达式用于解析HTML中的表格数据。


写入excel文件

matches = re.findall(pattern, text, re.S)
with open('weather_data.csv', 'a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    for match in matches:
        writer.writerow(match)


  • re.findall使用先前定义的正则表达式模式从网页内容中提取数据。
  • 提取的每条数据作为一个元组存储在matches中。
  • 遍历matches,将每个匹配项写入CSV文件中。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


二、数据分析可视化

1.饼状图(温度区间分布):

  • 这张饼状图展示了数据集中的最高温度分布在三个不同的温度区间(低温、中温、高温)中的比例。
  • 通过这张图,我们可以快速了解大部分时间内最高温度主要集中在哪个区间。例如,如果大部分温度都在中温区间,这可能意味着该地区的气候较为温和。
  • 饼图还可以帮助识别极端天气条件的频率,例如低温或高温天气的出现比例。


02cbec24a1594aa5bcc238d999947228.png


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


2.柱状图(最高气温前10名):

  • 该柱状图显示了从15年间记录的最高温度的前10个最高值及其对应的日期。
  • 这可以帮助我们识别特定年份中出现极端高温的具体日期,有助于分析可能的季节性高温模式或异常气候事件。
  • 柱状图还可以用来评估最高温度的变化范围,了解这些极端高温事件之间的温度差异。

97ab3c2392794f5c8f65ba71e81aecfe.png

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


3.散点图(所有温度散点图):

  • 散点图展示了整个时间段内所有记录的最高温和最低温数据点。
  • 通过这种图表,我们可以观察到温度随时间的变化趋势,包括季节性变化和年度变化。
  • 这张图还可以揭示温度波动的模式,比如某些特定月份或年份是否存在温度异常。
  • 分析最高温和最低温之间的关系,可以帮助我们了解夜间和白天的温差,这对于评估日温差和潜在的农业或健康影响尤为重要。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


1.年度平均最高温和最低温变化:

  • 该图展示了每年的平均最高温度和平均最低温度。
  • 通过这张图,我们可以观察到每年的温度波动趋势,分析温度随时间的长期变化情况。
  • 折线图可以揭示出温度随季节或年份变化的趋势,比如是否有逐年上升或下降的模式。
  • 同时,图中也可能显示出特定年份的异常温度变化,这可能与特定的气候事件或环境因素有关。
  • 通过同时展示每年的平均最高温和平均最低温,可以对比分析在同一年内温差的变化。
  • 这种对比有助于了解不同季节之间的温差变化,特别是在考虑到气候变暖或冷却趋势的情况下。



👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


相关文章
|
5天前
|
数据采集 数据安全/隐私保护 Python
从零开始:用Python爬取网站的汽车品牌和价格数据
在现代化办公室中,工程师小李和产品经理小张讨论如何获取懂车帝网站的汽车品牌和价格数据。小李提出使用Python编写爬虫,并通过亿牛云爬虫代理避免被封禁。代码实现包括设置代理、请求头、解析网页内容、多线程爬取等步骤,确保高效且稳定地抓取数据。小张表示理解并准备按照指导操作。
从零开始:用Python爬取网站的汽车品牌和价格数据
|
1月前
|
数据采集 Web App开发 数据可视化
Python用代理IP获取抖音电商达人主播数据
在当今数字化时代,电商直播成为重要的销售模式,抖音电商汇聚了众多达人主播。了解这些主播的数据对于品牌和商家至关重要。然而,直接从平台获取数据并非易事。本文介绍如何使用Python和代理IP高效抓取抖音电商达人主播的关键数据,包括主播昵称、ID、直播间链接、观看人数、点赞数和商品列表等。通过环境准备、代码实战及数据处理与可视化,最终实现定时任务自动化抓取,为企业决策提供有力支持。
|
自然语言处理 算法 Python
|
自然语言处理 算法 索引
|
2月前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!
|
2月前
|
存储 数据采集 人工智能
Python编程入门:从零基础到实战应用
本文是一篇面向初学者的Python编程教程,旨在帮助读者从零开始学习Python编程语言。文章首先介绍了Python的基本概念和特点,然后通过一个简单的例子展示了如何编写Python代码。接下来,文章详细介绍了Python的数据类型、变量、运算符、控制结构、函数等基本语法知识。最后,文章通过一个实战项目——制作一个简单的计算器程序,帮助读者巩固所学知识并提高编程技能。
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
126 80
|
22天前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
58 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
3月前
|
存储 索引 Python
Python编程数据结构的深入理解
深入理解 Python 中的数据结构是提高编程能力的重要途径。通过合理选择和使用数据结构,可以提高程序的效率和质量
171 59
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
51 14

热门文章

最新文章