开发者社区> 问答> 正文

使用bs4抓豆瓣网站美图代码分享

# --*-- coding:utf-8 --*--
from bs4 import BeautifulSoup
import urllib2
import urllib
import os


num=0
def ZhiZhuDownImag(url):
    headers={'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}  
    req=urllib2.Request(url,headers=headers) #创建请求对象
    html=urllib2.urlopen(req,timeout=30)     #发送http请求
    htmlcontent=html.read()                  #获取源码
    soup=BeautifulSoup(htmlcontent,'html.parser')
    meinvs=soup.find_all('img')
    for meinv in meinvs:
        imaglink=meinv.get('src')
        global num
        urllib.urlretrieve(imaglink,'meinv/%d.jpg'%num)
        num+=1
        print "已经下载第%d张美图" %num
if not os.path.exists('meinv'):
    os.mkdir('meinv')
for i in range(1,50):  #下载50页的图片
    url = "http://www.dbmeinv.com/?pager_offset=%d"%i
    ZhiZhuDownImag(url)





展开
收起
xuyuan.xy 2017-07-24 16:58:28 3403 0
1 条回答
写回答
取消 提交回答
  • 您的帖子很精彩!希望很快能再分享您的下一帖!
    2017-07-28 02:53:16
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
优酷质保秘籍 立即下载
长安十二时辰背后的技术秘籍 立即下载
PHP安全开发:从白帽角度做安全 立即下载