# -*- coding:utf-8 -*-
import requests
from urllib import urlencode
import urllib
from requests.exceptions import RequestException
import re
import os
def get_info(offset,keyword):
data = {'offset':offset,
'format':'json',
'keyword':keyword,
'autoload':'true',
'count':'20',
'cur_tab':'1'}
url = 'http://www.toutiao.com/search_content/?'+urlencode(data)
try:
response=requests.get(url)
if response.status_code == 200:
json=response.json()
for item in json.get('data'):
articl_url=item.get('article_url')
html=requests.get(articl_url).text
reg=r'img src="(.*?)"'
imag_url=re.findall(reg,html)
if len(imag_url) != 0:
for url in imag_url:
global num
urllib.urlretrieve(url, 'jiepai/%d.jpg' %num)
print "已下载第%d 美照" %num
num += 1
else:
continue
except RequestException:
print 'error'
num=1
if not os.path.exists('jiepai'):
os.mkdir('jiepai')
for i in range(0,1000,20):
get_info(i,'街拍')
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。