虎牙小姐姐照片

简介: 概述最近几年由于网络直播的兴起,直播行业也是越来越火,一些老宅男也是比较喜欢看小姐姐,然而许多人却会碰到直播界面图片不会保存的问题,那么接下来我将用十几行代码告诉你如何拿到大量美女图片,拿去做手机壁纸。

开发工具

python 3.5以上 或者pycharm

相关模块

requests模块(爬虫模块) —pip install requests

re(正则表达式模块,用于字符串匹配)

os (操作系统功能模块)

步骤

进入虎牙官网,点击分类中的颜值,就进入当前目标区了

image.png

右键检查在元素中即可定位到图片连接,即是我们的目标,这里我们可以看到

src属性所包含的图片链接的问号后有参数,在程序中处理掉即可拿到高清大图

image.png

import requests
import re
import os
#在当前目录建一个名为虎牙美女图片的文件夹
if not os.path.exists('./虎牙美女图片'):
    os.mkdir('./虎牙美女图片')
url = 'https://www.huya.com/g/2168'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.74'
}
page_text = requests.get(url=url,headers=headers).text
#匹配出图片链接
ex = '<img class="pic" data-original="(.*?)" src=".*?</div>'
img_list = re.findall(ex,page_text,re.S)
#print(img_list)
for one in img_list:
    #去掉?后的参数,将图片转换为大图
    new_url = one.split('?')[0]
    img_data = requests.get(url=new_url,headers=headers).content
    img_name = new_url.split('_')[-1]
    #print(img_name)
    img_path = './虎牙美女图片/'+img_name
    with open(img_path,'wb') as fp:
        fp.write(img_data)
        print(img_name,'下载完成!')

结语

在这篇文章中采用的是从网页源代码中获取图片链接,并且未做分页处理

要想分页获取更多图片,在这里小编提供两种方法,感兴趣的可以自己去试试:

法一:利用selenium模块,获取当前网页源代码,提取图片链接,然后执行点击下一页,继续提取图片链接,直到下一页不能点击。

法二:继续用requests模块,我们发现点击下一页产生的数据是由ajax产生的,网页url并未变化,通过在network的xhr中抓包,我们在其中的一条数据中可以找到点击下一页而产生的图片链接,并且请求的字符串参数中有num参数控制页数,通过这个可以写一个控制下载页数的爬虫。

好了,方法都已经告诉你们了,欢迎尝试与挑战!!!有不会的可以在评论区或者私信问我,小编会一一解答。

最后,喜欢不妨三连哦~~~

相关文章
|
6月前
|
人工智能 分布式计算 大数据
大数据& AI 产品月刊【2025年4月】
大数据& AI 产品技术月刊【2025年4月】,涵盖4月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
8月前
简约的域名主页HTML源码带暗黑模式
简约的域名主页HTML源码带暗黑模式
261 17
|
8月前
|
机器学习/深度学习 人工智能 算法
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,支持自定义相机轨迹和多种动态路径,生成高质量且时间平滑的视频。
517 0
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
|
6月前
|
数据可视化 Rust 机器学习/深度学习
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
mlop.ai 是首个为国区用户优化的机器学习工具,全栈免费开源,是主流付费解决方案 ClearML/WandB 的开源平替。常规实验追踪的工具经常大幅人为降速,mlop因为底层为Rust代码,能轻松支持高频数据写入。如需更多开发者帮助或企业支持,敬请联系cn@mlop.ai
372 12
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
|
7月前
|
Java
【源码】【Java并发】【ConcurrentHashMap】适合中学体质的ConcurrentHashMap
本文深入解析了ConcurrentHashMap的实现原理,涵盖JDK 7与JDK 8的区别、静态代码块、构造方法、put/get/remove核心方法等。JDK 8通过Node数组+链表/红黑树结构优化并发性能,采用CAS和synchronized实现高效锁机制。文章还详细讲解了hash计算、表初始化、扩容协助及计数更新等关键环节,帮助读者全面掌握ConcurrentHashMap的工作机制。
191 6
【源码】【Java并发】【ConcurrentHashMap】适合中学体质的ConcurrentHashMap
|
7月前
|
Java 中间件 调度
【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递
本文涉及InheritableThreadLocal和TTL,从源码的角度,分别分析它们是怎么实现父子线程传递的。建议先了解ThreadLocal。
287 4
【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递
|
移动开发 HTML5
HTML5熊猫弹跳手机小游戏源码
一款html5手机端小游戏源码,熊猫跳跃小游戏源码下载。熊猫脚底有弹簧,长按变化力度跳跃,计分游戏,html5手机熊猫也疯狂小游戏源代码。
298 5
|
缓存 编解码 JavaScript
快速掌握 Flutter 图片开发核心技能
快速掌握 Flutter 图片开发核心技能
501 0
|
移动开发 HTML5
唯美首页纯静态html源码
唯美首页纯静态html5引导页源码,格子化win8风格官方引导页面源码
418 0
唯美首页纯静态html源码
|
运维 搜索推荐 vr&ar
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.1 游戏泛娱乐定义
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.1 游戏泛娱乐定义
453 0