北方“吃土”预警,沙尘暴又双叒叕来了

简介: 如何使用python获取历史上的沙尘暴数据

4月10日晚间,一场影响北方大部地区的沙尘暴引发大家的关注,北京发布大风、沙尘暴双预警,不少网友表示出门像打开“护眼模式”并且值得关注的是目前的这次沙尘天气过程是今年以来第8次,常年同期的沙尘过程次数是5至6次,今年沙尘出现的次数略偏多。
QQ图片20230411151900.png

不知道历史上每年出现沙尘天气的次数相比今年是怎么样的,这里我们通过python爬取爬取历史天气数据来进行分析。
首先简单的进行爬取步骤分析,
1.python库的选择,这里我使用的是Python中的BeautifulSoup库进行爬取,BeautifulSoup库是一个能够从HTML文件中提取数据的Python库,由于我们获取的HTML文件包含整个网页内容,我们还需要定位到我们所需要获取的数据部分。
2.分析网页结构,需要先打开我们要爬取的网页,使用谷歌浏览器等开发者工具快速定位到我们所需要的HTML内容:
3.存储数据,数据获取到后需要将数据以结构化的方式存储起来。
接下来就是爬取数据的实际操作,因为天气网大量访问是会触发一些反爬机制的,所以爬取过程中在代码里面添加了代理IP,选择的是由亿牛云提供的隧道爬虫代理,因为不管是代理延迟,访问速度,稳定性都是最优的。实现代码如下:
``#! -- encoding:utf-8 --

import requests
import random

# 要访问的目标页面
targetUrl = "https://www.tianqi.com//"

# 要访问的目标HTTPS页面
# targetUrl = "https://www.tianqi.com//"
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "udfejfhk"
proxyPass = "568547"

proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
    "host" : proxyHost,
    "port" : proxyPort,
    "user" : proxyUser,
    "pass" : proxyPass,
}

# 设置 http和https访问都是用HTTP代理
proxies = {
    "http"  : proxyMeta,
    "https" : proxyMeta,
}


#  设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}



resp = requests.get(targetUrl, proxies=proxies, headers=headers)

print resp.status_code
print resp.text
相关文章
|
存储 消息中间件 弹性计算
福利局:阿里云又双叒叕送天猫卡啦!无门槛体验即可得!
7月7日-7月20日活动期间,完成【搭建基于OSS的图片分享网站】任意一个场景即可抢10元猫超卡!工作日每日10点发放30张,可提前完成任务,下个工作日10点来抢!先到先得!
314 0
福利局:阿里云又双叒叕送天猫卡啦!无门槛体验即可得!
|
人工智能 算法 前端开发
你是什么垃圾?阿里程序员又双叒叕放大招了
“干垃圾,还是湿垃圾?你是什么垃圾?”经过48小时紧急开发,昨天(7月3日),由阿里程序员志愿者开发的AI智能识别垃圾功能(测试版)在手机淘宝上线。
187 0
你是什么垃圾?阿里程序员又双叒叕放大招了
|
移动开发 开发框架 运维
蚂蚁金服mPaaS又双叒叕获奖啦!
蚂蚁金服mPaaS又双叒叕获奖啦!
717 0
蚂蚁金服mPaaS又双叒叕获奖啦!
|
机器学习/深度学习 搜索推荐 算法
阿里搜索推荐系统又双叒叕升级了?!
搜索导购产品作为搜索的流量入口,承载了为用户导购推荐、搜索流量分流的重要功能。主要产品包括:首页底纹、下拉推荐、搜索发现、导航、历史搜索等。
16755 0
印度:失业率达24.7%,推2700亿美元纾困计划救小企业
5月12日,印度总理纳伦德拉·莫迪(Narendra Modi)宣布了一个针对劳工和小企业的20万亿卢比(2660亿美元)纾困计划。
泰国:推第三个疫情纾困计划,规模580亿美元
泰国财政部长Uttama Savanayana表示,泰国内阁已于4月7日批准了一个规模为1.9万亿泰铢(578.7亿美元)的一揽子经济纾困计划,以减疫情造成的影响。
|
搜索推荐 算法 机器学习/深度学习
阿里搜索推荐系统又双叒叕升级了!
搜索导购产品作为搜索的流量入口,承载了为用户导购推荐、搜索流量分流的重要功能。主要产品包括:首页底纹、下拉推荐、搜索发现、导航、历史搜索等。
1434 0
|
人工智能 城市大脑 大数据
|
存储 双11
10月30日科技联播:天猫上线“价格雷达”监测双11商品价格;中国存储芯片厂福建晋华在美被禁
天猫上线“价格雷达”监测系统,实时校验天猫双11商品价格;福建晋华步中兴后尘,美国制裁中国内存芯片公司,称威胁其国家安全;小米回应“财政部点名”:问题均已整改完成,没有偷逃税;ofo完成电单车专利申请,一起来看今天的科技快讯!
1196 0