Python爬虫之美女图片分类-阿里云开发者社区

Python爬虫之美女图片分类

2017-09-13 1494

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 对爬取到的图片进行分类命名，下面开始了。一、首先给出URL地址www.wmpic.me/touxiang/nvsheng唯美图片二、下载图片，进行分析，并保存图片至本地，直接上代码import requestsfrom bs4...

对爬取到的图片进行分类命名，下面开始了。

一、首先给出URL地址www.wmpic.me/touxiang/nvsheng

唯美图片

二、下载图片，进行分析，并保存图片至本地，直接上代码

import requests

from bs4 import BeautifulSoup

import random

user_agent = [

'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)',

'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',

]

Yes_or_Not = ['y','n']

def download(url,folder,count=0): #下载图片

headers = {'User-Agent':random.choice(user_agent)}

content = requests.get(url,headers=headers).content

typ = random.choice(Yes_or_Not) #机器随机选择是Y还是N

path = folder + "\\" + typ + '_'+str(count)+'.jpg' #图片格式

with open(path,'wb') as f:

f.write(content) #写入并保存图片至本地文件

base_url = 'http://www.wmpic.me/touxiang/nvsheng/page/'

count = 1

for i in range(1,10):

url = base_url + str(i) #url地址

headers = {'User_Agent':random.choice(user_agent)}

html = requests.get(url,headers=headers).text

soup = BeautifulSoup(html,'lxml') #通过BeautifulSoup的lxml方法解析html

for item in soup.select('li img'): #解析定位到li img

picture_url = item['src']

if picture_url.find('215x185') != -1: #215x185图片的宽度和高度

if count <= 300:

download(picture_url,'train_pictures',count) #保存图片至train_pictures文件夹下

print(picture_url)

count += 1

else:

download(picture_url,'test_pictures',count) #保存图片至test_pictures文件夹下

print(picture_url)

count += 1

三、运行结果

图片URL

存放图片的本地文件夹

下载至本地分类好的图片

详细请参考（七）美女分类器

Python爬虫之美女图片分类

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Python爬虫之美女图片分类

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像