python之爬取某网站图片附带源码,求精

简介: 爬取网站图片,自动保存命名,多次循环遍历

先上效果:

开始步骤:

1.百度找我喜欢的图片,太多了,慢慢来,哦哦哦——————-。终于黄天不负有心人,

2.找到了:

3.开搞:起来

   (1)伪装浏览器(俺用的FIDDLER抓包,模拟谷歌吧)

def hander_request1(url, page, i):

   url = url + str(i) + '.html'
   headers = {

       'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36',


   }

   request = urllib.request.Request(url, headers=headers)

   return request


   # print(url)
   pass

   

2.正则拆分表单(这里写的复杂些)

part = re.compile(r'')

lt = part.findall(cont)

dirname = '美女'

# urllib.request.urlretrieve(str(lt), filepath)
print(lt)

url1 = str(lt).split('"')[1]

print(url1)

f1 = str(lt).split('"')[-2]

filename = f1

print(filename + ' 开始下载')

filepath = dirname + '/' + filename + '.jpg'
if not os.path.exists(dirname):

   os.mkdir(dirname)

# nt=mt.split()[0]


3.保存文件路径和名称

requset1 = urllib.request.Request(url=url1, headers=hd)

response1 = urllib.request.urlopen(requset1)

# urllib.request.urlretrieve(url1, filepath)
wenjianming = filename + '.jpg'
with open(wenjianming, 'wb') as fp:

   fp.write(response1.read())


# print(mt+'下载完成')
print(filename + ' 完成下载')


4.俺的图片都是分类的,套图得明白??

写了两个循环

def main():

   url = 'http://www.kantuba.net/guonei/'
   start_page = int(input('输入开始页码:'))

   end_page = int(input('请输入结束页码:'))

   #i网页计数器,可以用
   i = 0
   page = 0
   if start_page == 1:

       for i in range(10000, 10020):

           request = hander_request1(url, page, i)

           cont = urllib.request.urlopen(request).read().decode()

           download_image(cont)

           for page in range(start_page + 1, end_page):

               request = hander_request(url, page, i)

               cont = urllib.request.urlopen(request).read().decode()

               download_image(cont)

               # wenjianming = str(i) + str(page) + '.html'
               # with open(wenjianming, 'wb') as fp:
               #     fp.write(download_image(cont))
               #     # time.sleep(1)
               #     print(wenjianming + 'OK!')


   elif start_page != 1:

       for i in range(10000, 10020):

           for page in range(start_page, end_page):

               request = hander_request(url, page, i)

               cont = urllib.request.urlopen(request).read().decode()

               download_image(cont)


   pass


5.亲测效果杠杠的,拿走即可。拿回去只需要改正则表达式和URL。即可,被窝里看别忘了感谢我哦哦,啧啧啧!拿走不谢!

目录
打赏
0
0
0
0
1
分享
相关文章
基于mediapipe深度学习的手势数字识别系统python源码
本内容涵盖手势识别算法的相关资料,包括:1. 算法运行效果预览(无水印完整程序);2. 软件版本与配置环境说明,提供Python运行环境安装步骤;3. 部分核心代码,完整版含中文注释及操作视频;4. 算法理论概述,详解Mediapipe框架在手势识别中的应用。Mediapipe采用模块化设计,包含Calculator Graph、Packet和Subgraph等核心组件,支持实时处理任务,广泛应用于虚拟现实、智能监控等领域。
基于EM期望最大化算法的GMM参数估计与三维数据分类系统python源码
本内容展示了基于EM算法的高斯混合模型(GMM)聚类实现,包含完整Python代码、运行效果图及理论解析。程序使用三维数据进行演示,涵盖误差计算、模型参数更新、结果可视化等关键步骤,并附有详细注释与操作视频,适合学习EM算法与GMM模型的原理及应用。
企业微信自动加好友软件,导入手机号批量添加微信好友,python版本源码分享
代码展示了企业微信官方API的合规使用方式,包括获取access_token、查询部门列表和创建用户等功能
QQ机器人插件源码,自动回复聊天机器人,python源码分享
消息接收处理:通过Flask搭建HTTP服务接收go-cqhttp推送的QQ消息47 智能回复逻辑
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
501 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
基于python的租房网站-房屋出租租赁系统(python+django+vue)源码+运行
该项目是基于python/django/vue开发的房屋租赁系统/租房平台,作为本学期的课程作业作品。欢迎大家提出宝贵建议。
127 6
基于Python+Vue开发的体育场馆预约管理系统源码+运行
本项目为大学生课程设计作业,采用Python和Vue技术构建了一个体育场馆预约管理系统(实现前后端分离)。系统的主要目标在于帮助学生理解和掌握Python编程知识,同时培养其项目规划和开发能力。参与该项目的学习过程,学生能够在实际操作中锻炼技能,为未来的职业发展奠定良好的基础。
110 3
基于Python+Vue开发的房产销售管理系统源码+运行
基于Python+Vue开发的房产销售管理系统(前后端分离),这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能,同时锻炼他们的项目设计与开发能力。通过学习基于Python的房产销售管理系统项目,大学生可以在实践中学习和提升自己的能力,为以后的职业发展打下坚实基础。
70 2

热门文章

最新文章

推荐镜像

更多
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问