福利!!!Python爬取好看的妹子图!!!

简介: 大致步骤:第一步:找到我们要爬取的网站 https://www.vmgirls.com/这是个妹子图片的私人网站第二步:打开Vscode或者Pycharm都可以 复制我的代码,详细的解释写好了ps:requests库需要手动下载,按win+R输入cmd进入命令行模式,输入pip install requests安装requests库。

大致步骤:


第一步:找到我们要爬取的网站 https://www.vmgirls.com/这是个妹子图片的私人网站


第二步:打开Vscode或者Pycharm都可以 复制我的代码,详细的解释写好了


ps:requests库需要手动下载,按win+R输入cmd进入命令行模式,输入pip install

requests安装requests库。


第一部分,请求网页。


# 导入requests库
import requests 
# 导入re正则表达式库
import re 
# 导入系统内置库
import os 
headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)
#网页内容以文本形式打印出来
html = response.text 


设置标题headers防止反爬,标题这样设置的原因是因为我们要模仿我们真的是从这个网页下载图片而不是通过python来获取图片,所以用网站的标题就行了。

查看网站的标题: 在网页中按F12,在菜单栏中选择network可以看到网页的headers,复制粘贴就可以得到原headers了!


第二部分,获取网页内容


#为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] 
# 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):
    os.mkdir(dir_name)
 # 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)
# 打印获得的urls
print(urls)


第三部分,保存图片


# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:
    file_name = url.split('/')[-1]
    response = requests.get(url, headers = headers)
    with open(dir_name + '/' + file_name, 'wb') as f:
        f.write(response.content) 


以上是详细教程,完成啦!!!!!!!!!!!!!!


完整代码:


# 导入requests库
import requests 
# 导入re正则表达式库
import re 
# 导入系统内置库
import os 
headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)
#网页内容以文本形式打印出来
html = response.text 
#为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] 
# 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):
    os.mkdir(dir_name)
 # 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)
# 打印获得的urls
print(urls)
# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:
    file_name = url.split('/')[-1]
    response = requests.get(url, headers = headers)
    with open(dir_name + '/' + file_name, 'wb') as f:
        f.write(response.content) 
目录
打赏
0
0
0
0
110
分享
相关文章
小白也能用的代码!1行Python,把PPT转成1张长图
大家好,我是程序员晚枫。今天介绍`python-office`库的新功能:仅用1行Python代码将PPT转为单张长图。
91 11
 小白也能用的代码!1行Python,把PPT转成1张长图
|
6月前
|
Python 大神修炼手册:图的深度优先&广度优先遍历,深入骨髓的解析
【7月更文挑战第12天】Python进阶必学:DFS和BFS图遍历算法。理解图概念,用邻接表建无向图,实现DFS和BFS。DFS适用于查找路径,BFS解决最短路径。通过实例代码加深理解,提升编程技能。
57 4
|
6月前
|
逆袭之路!用 Python 玩转图的 DFS 与 BFS,让数据结构难题无处遁形
【7月更文挑战第12天】图的遍历利器:DFS 和 BFS。Python 中,图可表示为邻接表或矩阵。DFS 沿路径深入,回溯时遍历所有可达顶点,适合找路径和环。BFS 层次遍历,先近后远,解决最短路径问题。两者在迷宫、网络路由等场景各显神通。通过练习,掌握这些算法,图处理将游刃有余。
67 3
“解锁Python高级数据结构新姿势:图的表示与遍历,让你的算法思维跃升新高度
【7月更文挑战第13天】Python中的图数据结构用于表示复杂关系,通过节点和边连接。常见的表示方法是邻接矩阵(适合稠密图)和邻接表(适合稀疏图)。图遍历包括DFS(深度优先搜索)和BFS(广度优先搜索):DFS深入探索分支,BFS逐层访问邻居。掌握这些技巧对优化算法和解决实际问题至关重要。**
58 1
Python高手必备!揭秘图(Graph)的N种风骚表示法,让你的代码瞬间高大上
【7月更文挑战第10天】在Python中,图数据结构通过邻接矩阵、邻接表、边列表和邻接集来表示,用于社交网络分析和路径查找等。邻接矩阵用二维数组存储连接,邻接表仅存储每个节点的邻居,节省空间。边列表列出所有边,而邻接集用集合确保邻居唯一性。选择合适表示法能提升代码效率和可读性,展现编程技巧。
93 1
经验大分享:PYTHON爬取66影视的电影下载链接,有搜索功能
经验大分享:PYTHON爬取66影视的电影下载链接,有搜索功能
162 2
使用Python实现深度学习模型:图神经网络(GNN)
使用Python实现深度学习模型:图神经网络(GNN)
419 1
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等