实现抓图的工具-阿里云开发者社区

开发者社区> 孤独的猫董> 正文

实现抓图的工具

简介: 实现抓图的工具 #encoding:UTF-8import urllibimport urllib2import reimport osfrom BeautifulSoup import BeautifulSoupdef GetUrlContent(url,path): #url = "http://www.
+关注继续查看

实现抓图的工具


#encoding:UTF-8

import  urllib
import urllib2
import re
import os
from BeautifulSoup import BeautifulSoup

def GetUrlContent(url,path):
    #url = "http://www.2cto.com/meinv/sexmv/"
    req = urllib2.urlopen(url)
    content = req.read()
    soup = BeautifulSoup(content)
    # print soup.pret()
    #查找左右链接,并且不含title属性
    alinks = soup.findAll('a', attrs={"target": "_blank"}, title=None)
    i = 0
    for a in alinks:
        surl = a['href']
        print surl
        GetUrl(surl,path)
        print " "
        print " "
        #print surl

def createFileWithFileName(localPathParam,fileName):
    totalPath=localPathParam+'\\'+fileName
    if not os.path.exists(totalPath):
        file=open(totalPath,'a+')
        file.close()
        return totalPath

def GetFileName(url):
    sFilename=os.path.basename(url)
    return sFilename

def GetUrl(myUrl,localPath):
    #url = "http://www.2cto.com/meinv/sexmv/1819.html"
    try:
        req = urllib2.urlopen(myUrl,None,5)
        content = req.read()
        soup = BeautifulSoup(content)
        alinks =soup.findAll("img",attrs={"src": re.compile("(.*)uploads/allimg(.*)")})

        for d in alinks:
            imgUrl=d["src"]
            print imgUrl
            fileName=GetFileName(imgUrl)
            print fileName
            urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName))
    except Exception,e:
        print "Error"

if __name__=='__main__':
    #GetUrl("http://www.2cto.com/meinv/sexmv/1810.html")
    print GetFileName("http://www.2cto.com/meinv/sexmv/1810.jpg")


如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载,但是未经作者本人同意,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。
原文链接:https://yq.aliyun.com/articles/504382

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
8637 0
《数据挖掘:实用案例分析》——3.3 常用的建模工具
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第3章,第3.3节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1253 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10462 0
十个免费的Web压力测试工具
两天,jnj在本站发布了《如何在低速率网络中测试 Web 应用》,那是测试网络不好的情况。而下面是十个免费的可以用来进行Web的负载/压力测试的工具,这样,你就可以知道你的服务器以及你的WEB应用能够顶得住多少的并发量,以及你的网站的性能。
1476 0
SSH快速破解工具
http://www.noptrix.net/codes.html
529 0
十大网站管理工具
引用:http://www.williamlong.info/archives/1278.html 当网站发展到一定的规模,站长就应该开始考虑要为网站托管服务器。通常情况下服务器会被放到电信或网通的机房,网站管理员通过远程来管理服务器。
937 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
11432 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
6625 0
742
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载