Python实现对网站目录扫描

简介:

一个很简单的版本,以后会做进一步的修改:多线程,从文件中读取,跟据Head头判断等等.

需要提供一个网站和不存在页面的错误提示

CODE:

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import urllib
import urlparse
import HTMLParser

class CheckHTML(HTMLParser.HTMLParser):
    available = True
    def check_data(self,data,ErrorSym):
        error = ErrorSym
        if error in data:
            self.available = False

target = raw_input("Please enter your target:")
errorsyb = raw_input("Enter the errorsyb:(eg:404 Error)")
check_list = ['admin','inc','data','include','count']

for li in check_list:
    new_urls = urlparse.urljoin("http://"+target+"/",li)
    d = urllib.urlopen(new_urls)
    data = d.read()
    check = CheckHTML()
    check.check_data(data,errorsyb)
    if check.available:
        print "%s------------->Found!"%new_urls
    else:
        print "%s------------->Not Found!"%new_urls

--------------------------------------------------------------------------------------------

The Result maybe like this :

Please enter your target:www.fuck.com
Enter the errorsyb:(eg:404 Error)HTTP 错误 404
http://www.fuck.com/admin------------->Found!
http://www.fuck.com/inc------------->Not Found!
http://www.fuck.com/data------------->Found!
http://www.fuck.com/include------------->Found!
http://www.fuck.com/count------------->Found!


   















本文转sinojelly51CTO博客,原文链接:http://blog.51cto.com/pnig0s1992/401450,如需转载请自行联系原作者

相关文章
|
1月前
|
Python
在 Python 中,如何处理文件和目录?
在 Python 中,如何处理文件和目录?
60 0
|
1月前
|
安全 Unix Linux
在Python中,如何处理文件和目录的访问权限?
【2月更文挑战第15天】【2月更文挑战第43篇】在Python中,如何处理文件和目录的访问权限?
|
2月前
|
数据采集 数据可视化 数据挖掘
Python爬虫实战:抓取网站数据并生成报表
本文将介绍如何使用Python编写简单而高效的网络爬虫,从指定的网站上抓取数据,并利用数据分析库生成可视化报表。通过学习本文内容,读者将能够掌握基本的爬虫技术和数据处理方法,为日后开发更复杂的数据采集与分析工具打下坚实基础。
|
2月前
|
前端开发 关系型数据库 MySQL
基于python+mysql的宠物领养网站系统
基于python+mysql的宠物领养网站系统
36 2
|
3月前
|
BI Windows Python
python报表自动化系列 - 在Windows中打开指定目录
python报表自动化系列 - 在Windows中打开指定目录
31 1
|
3月前
|
BI Python
python报表自动化系列 - 获取指定目录所有文件绝对路径
python报表自动化系列 - 获取指定目录所有文件绝对路径
27 0
|
13天前
|
前端开发 测试技术 数据库
【python】为什么使用python Django开发网站这么火?
【python】为什么使用python Django开发网站这么火?
|
26天前
|
开发者 Python
Python语言的文件及目录访问
Python语言的文件及目录访问
|
1月前
|
Python
Python文件目录操作就是这么6
Python文件目录操作就是这么6
14 0
|
1月前
|
数据采集 存储 数据挖掘
Python爬虫实战:打造一个简单的新闻网站数据爬取工具
本文将介绍如何运用Python编写一个简单而高效的网络爬虫,帮助您在实际项目中快速获取并存储新闻网站的数据。通过学习本文,您将了解到如何利用Python中的第三方库和技术来实现数据爬取,为您的数据分析和应用提供更多可能性。