【python】python天气气候数据抓取分析可视化(源码+数据+可视化+报告)【独一无二】

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 【python】python天气气候数据抓取分析可视化(源码+数据+可视化+报告)【独一无二】

一、网页分析

爬取2345天气王网页的数据,进行数据分析可视化:


主要爬取了,主要包含日期、最高气温、最低气温、天气、风力风向等数据信息。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


这段Python代码主要用于从网站上抓取历史天气数据并保存到本地的CSV文件中。下面逐块解释每部分代码的功能:


导入模块

import re
import csv
import requests


  • re: 用于处理正则表达式,这在解析网页内容时非常有用。
  • csv: 用于读写CSV文件,这里主要用于保存抓取的数据。
  • requests: 用于发起网络请求,获取网页数据。


初始化CSV文件

with open('weather_data.csv', 'a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['日期', '最高温', '最低温', '天气', '风力风向'])
    file.close()


  • 这部分代码打开(或创建)一个名为weather_data.csv的文件,并设置为追加模式('a')。
  • 用csv.writer创建一个CSV写入器,然后写入表头,包括日期、最高温、最低温、天气和风力风向。
  • 文件使用UTF-8编码,以支持中文字符。
  • newline=''用于防止在写入行之间产生额外的空行。


爬取数据

for i in range(2011, 2025):
    for j in range(1, 13):
        url = f"https://tiaxxxx.com"


  • 使用双层循环遍历从2011年到2023年的每个月。
  • 构造URL以根据年份和月份请求对应的历史天气数据。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


设置请求头

headers = { ... }


  • headers字典包含了众多HTTP头部信息,这些信息用于模拟浏览器请求,避免被服务器识别为爬虫。


发送请求并解析数据

res = requests.get(url=url, headers=headers)
text = res.json()['data'].replace('\n', '').replace(' ', '')


  • 使用requests.get向构造的URL发送请求,传入之前设置的headers。
  • 从响应中提取JSON格式的数据,并进一步获取其中的data字段。然后移除响应中的换行符和空格,方便后续的数据处理。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


正则表达式解析

if i <= 2015:
    pattern = r'<tr><td>(.*?)</td><tdstyle="[^>]*">(.*?)</td><tdstyle="[^>]*">(.*?)</td><td>(.*?)</td><td>(.*?)</td>'
else:
    pattern = r'<tr><td>(.*?)</td><tdstyle="[^>]*">(.*?)</td><tdstyle="[^>]*">(.*?)</td><td>(.*?)</td><td>(.*?)</td>'


  • 根据不同的年份选择不同的正则表达式模式。尽管这里两个模式看起来一样,实际使用中可能有微小的差别。
  • 正则表达式用于解析HTML中的表格数据。


写入excel文件

matches = re.findall(pattern, text, re.S)
with open('weather_data.csv', 'a', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    for match in matches:
        writer.writerow(match)


  • re.findall使用先前定义的正则表达式模式从网页内容中提取数据。
  • 提取的每条数据作为一个元组存储在matches中。
  • 遍历matches,将每个匹配项写入CSV文件中。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


二、数据分析可视化

1.饼状图(温度区间分布):

  • 这张饼状图展示了数据集中的最高温度分布在三个不同的温度区间(低温、中温、高温)中的比例。
  • 通过这张图,我们可以快速了解大部分时间内最高温度主要集中在哪个区间。例如,如果大部分温度都在中温区间,这可能意味着该地区的气候较为温和。
  • 饼图还可以帮助识别极端天气条件的频率,例如低温或高温天气的出现比例。


02cbec24a1594aa5bcc238d999947228.png


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


2.柱状图(最高气温前10名):

  • 该柱状图显示了从15年间记录的最高温度的前10个最高值及其对应的日期。
  • 这可以帮助我们识别特定年份中出现极端高温的具体日期,有助于分析可能的季节性高温模式或异常气候事件。
  • 柱状图还可以用来评估最高温度的变化范围,了解这些极端高温事件之间的温度差异。

97ab3c2392794f5c8f65ba71e81aecfe.png

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


3.散点图(所有温度散点图):

  • 散点图展示了整个时间段内所有记录的最高温和最低温数据点。
  • 通过这种图表,我们可以观察到温度随时间的变化趋势,包括季节性变化和年度变化。
  • 这张图还可以揭示温度波动的模式,比如某些特定月份或年份是否存在温度异常。
  • 分析最高温和最低温之间的关系,可以帮助我们了解夜间和白天的温差,这对于评估日温差和潜在的农业或健康影响尤为重要。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


1.年度平均最高温和最低温变化:

  • 该图展示了每年的平均最高温度和平均最低温度。
  • 通过这张图,我们可以观察到每年的温度波动趋势,分析温度随时间的长期变化情况。
  • 折线图可以揭示出温度随季节或年份变化的趋势,比如是否有逐年上升或下降的模式。
  • 同时,图中也可能显示出特定年份的异常温度变化,这可能与特定的气候事件或环境因素有关。
  • 通过同时展示每年的平均最高温和平均最低温,可以对比分析在同一年内温差的变化。
  • 这种对比有助于了解不同季节之间的温差变化,特别是在考虑到气候变暖或冷却趋势的情况下。



👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 气候版本二 ” 获取。👈👈👈


相关文章
|
4天前
|
数据挖掘 PyTorch TensorFlow
|
6天前
|
机器学习/深度学习 数据采集 算法
时间序列结构变化分析:Python实现时间序列变化点检测
在时间序列分析和预测中,准确检测结构变化至关重要。新出现的分布模式往往会导致历史数据失去代表性,进而影响基于这些数据训练的模型的有效性。
25 1
|
1天前
|
算法 Python
揭秘!Python数据魔术师如何玩转线性回归,让你的预测精准到不可思议
【9月更文挑战第13天】在数据科学领域,线性回归以其优雅而强大的特性,将复杂的数据关系转化为精准的预测模型。本文将揭秘Python数据魔术师如何利用这一统计方法,实现令人惊叹的预测精度。线性回归假设自变量与因变量间存在线性关系,通过拟合直线或超平面进行预测。Python的scikit-learn库提供了简便的LinearRegression类,使模型构建、训练和预测变得简单直接。
11 5
|
3天前
|
存储 算法 测试技术
预见未来?Python线性回归算法:数据中的秘密预言家
【9月更文挑战第11天】在数据的海洋中,线性回归算法犹如智慧的预言家,助我们揭示未知。本案例通过收集房屋面积、距市中心距离等数据,利用Python的pandas和scikit-learn库构建房价预测模型。经过训练与测试,模型展现出较好的预测能力,均方根误差(RMSE)低,帮助房地产投资者做出更明智决策。尽管现实关系复杂多变,线性回归仍提供了有效工具,引领我们在数据世界中自信前行。
17 5
|
3天前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
17 5
|
3天前
|
存储 安全 算法
RSA在手,安全我有!Python加密解密技术,让你的数据密码坚不可摧
【9月更文挑战第11天】在数字化时代,信息安全至关重要。传统的加密方法已难以应对日益复杂的网络攻击。RSA加密算法凭借其强大的安全性和广泛的应用场景,成为保护敏感数据的首选。本文介绍RSA的基本原理及在Python中的实现方法,并探讨其优势与挑战。通过使用PyCryptodome库,我们展示了RSA加密解密的完整流程,帮助读者理解如何利用RSA为数据提供安全保障。
15 5
|
4天前
|
数据采集 数据挖掘 数据处理
使用Python和Pandas处理CSV数据
使用Python和Pandas处理CSV数据
29 5
|
1天前
|
机器学习/深度学习 搜索推荐 算法框架/工具
使用Python实现深度学习模型:智能运动表现分析
使用Python实现深度学习模型:智能运动表现分析
12 1
|
5天前
|
数据采集 存储 数据挖掘
使用Python读取Excel数据
本文介绍了如何使用Python的`pandas`库读取和操作Excel文件。首先,需要安装`pandas`和`openpyxl`库。接着,通过`read_excel`函数读取Excel数据,并展示了读取特定工作表、查看数据以及计算平均值等操作。此外,还介绍了选择特定列、筛选数据和数据清洗等常用操作。`pandas`是一个强大且易用的工具,适用于日常数据处理工作。
|
6天前
|
安全 数据安全/隐私保护 Python
情书也能加密?Python AES&RSA,让每一份数据都充满爱的密码
【9月更文挑战第8天】在这个数字化时代,情书不再局限于纸笔,也可能以电子形式在网络中传递。为了确保其安全,Python提供了AES和RSA等加密工具,为情书编织爱的密码。首先,通过安装pycryptodome库,我们可以利用AES对称加密算法高效保护数据;接着,使用RSA非对称加密算法加密AES密钥和IV,进一步增强安全性。即使情书被截获,没有正确密钥也无法解读内容。让我们用Python为爱情编织一张安全的网,守护每份珍贵情感。
21 2