虎牙小姐姐照片

简介: 概述最近几年由于网络直播的兴起,直播行业也是越来越火,一些老宅男也是比较喜欢看小姐姐,然而许多人却会碰到直播界面图片不会保存的问题,那么接下来我将用十几行代码告诉你如何拿到大量美女图片,拿去做手机壁纸。

开发工具

python 3.5以上 或者pycharm

相关模块

requests模块(爬虫模块) —pip install requests

re(正则表达式模块,用于字符串匹配)

os (操作系统功能模块)

步骤

进入虎牙官网,点击分类中的颜值,就进入当前目标区了

image.png

右键检查在元素中即可定位到图片连接,即是我们的目标,这里我们可以看到

src属性所包含的图片链接的问号后有参数,在程序中处理掉即可拿到高清大图

image.png

import requests
import re
import os
#在当前目录建一个名为虎牙美女图片的文件夹
if not os.path.exists('./虎牙美女图片'):
    os.mkdir('./虎牙美女图片')
url = 'https://www.huya.com/g/2168'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.74'
}
page_text = requests.get(url=url,headers=headers).text
#匹配出图片链接
ex = '<img class="pic" data-original="(.*?)" src=".*?</div>'
img_list = re.findall(ex,page_text,re.S)
#print(img_list)
for one in img_list:
    #去掉?后的参数,将图片转换为大图
    new_url = one.split('?')[0]
    img_data = requests.get(url=new_url,headers=headers).content
    img_name = new_url.split('_')[-1]
    #print(img_name)
    img_path = './虎牙美女图片/'+img_name
    with open(img_path,'wb') as fp:
        fp.write(img_data)
        print(img_name,'下载完成!')

结语

在这篇文章中采用的是从网页源代码中获取图片链接,并且未做分页处理

要想分页获取更多图片,在这里小编提供两种方法,感兴趣的可以自己去试试:

法一:利用selenium模块,获取当前网页源代码,提取图片链接,然后执行点击下一页,继续提取图片链接,直到下一页不能点击。

法二:继续用requests模块,我们发现点击下一页产生的数据是由ajax产生的,网页url并未变化,通过在network的xhr中抓包,我们在其中的一条数据中可以找到点击下一页而产生的图片链接,并且请求的字符串参数中有num参数控制页数,通过这个可以写一个控制下载页数的爬虫。

好了,方法都已经告诉你们了,欢迎尝试与挑战!!!有不会的可以在评论区或者私信问我,小编会一一解答。

最后,喜欢不妨三连哦~~~

相关文章
|
4月前
|
人工智能 分布式计算 大数据
大数据& AI 产品月刊【2025年4月】
大数据& AI 产品技术月刊【2025年4月】,涵盖4月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
欢迎来到王者荣耀!
欢迎来到王者荣耀!
357 1
|
7月前
|
传感器 监控 大数据
指挥学校大数据系统解决方案
本系统集成九大核心平台,包括中心化指挥、数据处理、学生信息、反校园欺凌大数据、智慧课堂、学生行为综合、数据交换及其他外部系统云平台。通过这些平台,系统实现对学生行为、课堂表现、校园安全等多维度的实时监控与数据分析,为教育管理、执法机关、心理辅导等提供强有力的数据支持。特别地,反校园欺凌平台利用多种传感器和智能设备,确保及时发现并处理校园霸凌事件,保障学生权益。同时,系统还涵盖超市、食堂、图书馆、消防安全等辅助云平台,全面提升校园智能化管理水平。
|
10月前
|
安全 测试技术 数据安全/隐私保护
原生鸿蒙的竞争力到底如何?
长期以来,移动操作系统市场被IOS和安卓所垄断,一直都难以推出完整的自主系统,面临诸多挑战,如推广困难、应用适配难度大,以及技术底座缺乏自主性。但原生鸿蒙操作系统展示其在突破这些瓶颈方面的努力,基于安全牢固的“鸿蒙内核”,上层应用的开发与创新得以实现,不再被卡脖子,更不牵制于外界。本身该系统在OS内核、框架、数据库等方面进行全面自研,实现真正的自主可控。
362 4
|
11月前
|
Web App开发 JSON JavaScript
爬取王者荣耀图片
【10月更文挑战第11天】爬取王者荣耀图片。
333 2
|
12月前
|
存储 机器学习/深度学习 人工智能
深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的发展,智能体(AI Agents)逐渐成为人与大模型交互的主要方式。智能体能执行任务、解决问题,并提供个性化服务。其关键组成部分包括规划、记忆和工具使用,使交互更加高效、自然。智能体的应用涵盖专业领域问答、资讯整理、角色扮演等场景,极大地提升了用户体验与工作效率。借助智能体开发平台,用户可以轻松打造定制化AI应用,推动AI技术在各领域的广泛应用与深度融合。
22342 1
|
存储 数据采集 JSON
英雄联盟手游能“干掉”王者荣耀?微博4.3亿网友吵翻了……
英雄联盟手游能“干掉”王者荣耀?微博4.3亿网友吵翻了……
249 3
英雄联盟手游能“干掉”王者荣耀?微博4.3亿网友吵翻了……
|
存储 安全 Cloud Native
阿里云数据库多款产品支持米哈游新游《绝区零》全球开服!
这一次,阿里云继续与大家共同守护「新艾利都」!
|
机器学习/深度学习 自然语言处理 算法
从学校到职场:在阿里的这7年(内含招聘)
本文不仅希望能给一些初入职场的同学一些思考,也是通过自己阿里7年的总结,对自己未来的一种期望,也希望自己未来再遇到槽糕的处境迷茫的时候,可以回看下自己的心路历程,并做出更理性的选择。
19074 6
从学校到职场:在阿里的这7年(内含招聘)
|
JavaScript 前端开发 Java
Java实现QQ空间相册的漂亮动态代码,新手必学
藤新版 javascript:window.top.space_addItem(23,38542,830,150,0,300,150); 太阳花 javascript:window.top.space_addItem(23,38540,830,150,0,300,150); 矢车菊 javascript:window.top.space_addItem(23,38538,830,150,0,300,150); 康乃馨 javascript:window.top.space_addItem(23,38536,830,150,0,300,150); 百合