Web 信息收集之搜索引擎_2 | 学习笔记

简介: 快速学习 Web 信息收集之搜索引擎_2

开发者学堂课程【网络安全攻防 - Web渗透测试Web 信息收集之搜索引擎_2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/630/detail/9917


Web 信息收集之搜索引擎_2


Google Hacking

1intitle

1)功能:搜索标题存在特定关键字的网页

2)示例:

① intitle:后台登录

搜索网页标题是“后台登录”的相关网页

② intitle:后台管理 filetype:php

搜索网页标题是“ 后台管理”的 php 页面

③ intitle:index of "keyword"

搜索此关键字相关的索引目录信息

④ intitle:index of "parent directory"

搜索根目录相关的索引目录信息

搜到的是 index of 内容,内容当中包含 index of "parent directory"这一段,标题中有 index of。这是什么东西但是是有 index,这些是要提供下载的网站,也不一定是提供下载的,也有可能是它网站的目录,设置有问题,提供的一个遍历的功能,目录浏览的功能,有可能是某一个目录提供这样一个东西,Apache nginx 里面有里面有一项设置,就是允许目录索引。当访问这个网站目录的时候,如果没有找到首页的文件,就应该不显示,但是如果由于设置不当,可能造成目录的一个索引功能,目录索引本身是正常的,如果使 Apache 来提供这种或者 nginx 提供这种什么下载的功能,可以索引,但有一些索引可能并不是管理员想要的效果,但是这个就被搜到。

image.png

① intitle:index of "password"

搜索密码相关的索引目录信息,index 本身就是索引

② intitle:index of "login"

搜索登录页面信息

也是索引里面带 login,网站的登陆页

image.png

这里有 mysql.sql 下载看一下,可以看到用户名和密码,用 md5的破解工具在线破解工具可以转换,这个方式是非常具有攻击行为的方式。

image.png

① intitle:index of "admin"

搜索后台管理页面信息

2intext

1)功能:搜索正文存在特定关键字的网页

2)示例:

① intext:Powered by Discuz

搜索 Discuz 论坛相关的页面

在整个网站的里面,可以看到 powered by Discuz同样版本也会出来,这样就可以搜到哪些站点使用的是 Discuz而且它有相应的漏洞,找到它

② intext:powered by wordpress

搜索 wordpress 制作的博客网址,powered by wordpress 可能是在内容中或者文章当中,或者在下面明确说明是powered by wordpres 构建的,不知道在哪个地方,可以 ctrl+f 搜索

③ intext:Powered by *CMS

搜索*CMS 相关的页面,不知道是哪个 CMS那么就海量搜索

像郑州大学全媒体实验教学示范中心,使用的是这款 CMS 构建的网站

image.png

CMS 叫做内容管理系统或者界面系统,是'Content Management System'的缩写,在国内有很多比较知名的,CMS 或者帝国 CMSCMS 的网站它不是从零到有,从无到有一点点去开发功能,都是基于某一个 CMS比如帝国dede梦一些 CMS,可以在后面加一个词,可以看到很多建站系统。

它会有一些模版,直接进行开发,在互联网上访问的大多数这种网站都是基于这种各式各类的建站系统,像帝国,这是很常见的。这些产品它们本身不同的版本是有不同漏洞,想象一下如果有10万个公司使用梦某一个版本,而这个版本爆出漏洞,这可能就会被攻击,因为它们使用的是同一款建站系统。CMS 它是全称叫内容管理系统,一般叫做建站系统,就是基于它的基础之上再去完成公司业务的一些工种的开发,一般去买这种建站系统,它的底部都可能会有信息

image.png

CMS 可能在前面还有一个名字,织梦或者帝国,如果下面有这种信息,说明这个网站有可能是由建站系统构建,再看是什么版本,找相应的版本有没有漏洞。

① intext:powered by xxx inurl:login

搜索此类网址的后台登录页面

site 用来指定站点,而 filetype 指定稳定运行,inurl 指定 Url 当中出现某个关键字,intitle 指网站的标题出现的关键字,比如管理系统或后台登录的名字,intext 是指在正文当中不知道是在上面还是下面,有很多,可以 ctrl+f 搜索一下,比如出现 discuz 或出现 wordpress

3、实例

1)搜索美女/电影等相关网站:

Inurl:php?id= intitle:美刷 url 里面带有 php?表示这是一个注入点,这是带有美剧的

Inurl:php?id= intitle:美女

Inurl:php?id= intitle:美女图片 intitle:powered by discuz

Inurl:php?id= intitle:美女图片 intitle:powered by *cms

2)搜索用 Discuz 搭建的论坛:

Inurl:php?id intitle:电影 intext: powered by discuz

搜索 url 带有关键字,intext: powered by discuz 这是正文

intext:powered by discuz! 7.2" inurl:faq .php  intitle:论坛

3)搜索使用 Struts 的相关网站:

intitle:"Struts Problem Report"

intitle:"Struts Problem Report" intext : "development mode is enabled. "

4、符号

1-keyword

强制结果不要出现此关键字,例如:电影 -黑客

2*keyword

模糊搜索,强制结果包含此关键字,例如:电影 一个叫*决定*通配符

(3)"keyword"

强制搜索结果出现此关键字,例如:书籍"web 安全",一般有空格的时候加,没空格的时候不加

5、参考

1)有网友已经把谷歌搜索做一个整理,做成以下这个图片就是如何从谷歌上获得什么更多的信息,是关于学生们做研究的技能,不知道来自哪里的调查结果,让人意外的是四分之三的学生都没有较好的利用网络搜索习惯,在资讯丰富的网络的互联网中,如何有效搜索那可是攸关关论文和报告能否准时搞定的关键技能。

(2)举例

① 你想搜什么?

纽约时报网站(nytimes.com)20082010年关于大学(college)

测验分数(test scores)但不是 SAT 入学分数的文章。

第一个是网站用 site,第二个是时间,第三个关于大学 college注意这里是关于大学,大学的叫法不只是叫 college也叫 university这里想要既有 college 也有 university相关的都要,还有测试分数,test scores但不是 SAT 入学分数的文章,排除这个。

② 怎样谷歌呢?

http://www.google.com/

site:nytimes.com ~college"test scores" -SATs 2008..2010

site:只搜索某个网站的页面。

“”:以整个短语作为搜索关键词,而不是拆开成每个词。

-:排除某个关键词。

~同时搜索近义词,比如'higher education''university'

··显示指定年份时间段内的搜索结果。

波浪线 college 表示只要跟 college 相近的都可以,整体要用引号括起来。时间只能代表爬取的时间,不能代表文章的一个新旧程度。

③ 你想搜什么?

一份关于常见燕子飞行速度的专业报告.

④ 怎样谷歌呢?

不要问谷歌问题。想一下答案会有哪些词语,然后搜索这些词语(例如不要搜索:XX 的飞行速度是多少?)

谷歌要的不是问题,要想一想,这个答案当中可能会有哪些内容,想要知道的是燕子飞行速度报告,不要燕子飞速速度是多少?不要问谷歌问题,要想一下答案当中会有哪些个词,搜索词即可。这个问题就是错的,这就是算法就是错的,而是应该这样搜索。

filetype:pdf air speed intitle:velocity of * swallow

filetype:只搜索指定类型的文档,可以用来搜索 pdfdoc, jpg 等类型的文档。

intitle:只显示标题中包含指定关键词的搜索结果(例如: velocity)

*星号用来代替任意字符(例如: '*swallow' 可以匹配' Red Rumped swallow' 'Lesser Striped swallow' 等,意为搜索各种燕子。)

⑤ 你想搜什么?

Dr. Ronald L. Green Dr. Thomas P. Buttz.所写的关于光和作用(photosynthesis)的论文。

⑥ 怎样谷歌呢?

http://scholar.google.com/

author:green photosynthesis "tp buttz'

author: 搜索 Green 发表的论文,而不是包含'green' 这个词的论文。这是作者。

这里的"photosynthesis" 就是一个普通的谷歌搜素,是你要找的主题关键字。

“”:想让结果更精确,你可以在引号中输入作者的全名或者是缩写。

⑦ 字词定义

快速查询字词定义。只要在你想了解的单词前面输入"define:",例如查询 angary 的定义:

define:angary

⑧ 数学计算

快速计算,别费力的启动你的计算器软件了。只需要直接在谷歌里输入数学算式就行了,算式可以包含+-*, 1和括号这些基本的算术功能。

(2*3)/5+44-1

⑨ 单位换算

方便的单位换算,只需要输入你想换算的两种单位。

54=?公斤

⑩ 快捷键

90%的互联网用户不知道可以使用 CtrI + F 在本页查找字符。如果你

是这90%其中一员,这部分内容就是为你而写由)

:快捷键的使用在 PC 机和 Mac 机上略有不同,因为在国内大多数童鞋用的是 PC 机,后面的提示均默认按照PC机用户的习惯而写,如果你使用的是 Ma c机、多数情况用"Command" 按键代替'Ctrl'

按键便可。

在本查找

调研中最重要的快捷键,在你正在查看的任一文档或页面,按下 CtrI+F 键,弹出搜索框后,输入你想查找的字符串,立刻,所有对应的字符串都为你而高亮显示。

CtrI+F

放大/缩小

有时候页面字体太小或者在线 PDF 文档勉强可以阅读,你可

以使用快捷键方便的放大或缩小页面。

Ctrl| +/-

放大是加号,缩小是减号。

选中浏览器地址栏

每次使用鼠标移动到地址栏是费神又费力,只要按下 CtrI+L 组合键,地址栏即刻选中。

Ctrl+L

切换标签页和程序

在电脑上做研究,随着你工作的开展,运行的应用程序和打开的窗口越来越多,烦扰着你。使用快捷键可以帮助你在不同的窗口和应用程序间切换,减轻你的烦乱。

PC

切换标登页:Ctrl+Tab

切换窗口:Alt+Tab

MAC

切换窗口:command+

切换应用程序:command+tab

这是总结的 google hacking 的东西,结合之前讲的一些内容加上一些技巧进行搜索,这是在谷歌上怎么获取想要的信息。

相关文章
|
13天前
|
弹性计算 JSON Shell
基于Web API的自动化信息收集和整理
【4月更文挑战第30天】
20 0
|
搜索推荐 应用服务中间件 Linux
Web 信息收集之搜索引擎_5 | 学习笔记
快速学习 Web 信息收集之搜索引擎_5
110 0
Web 信息收集之搜索引擎_5 | 学习笔记
|
搜索推荐 安全 网络协议
Web 信息收集之搜索引擎_3 | 学习笔记
快速学习 Web 信息收集之搜索引擎_3
147 0
Web 信息收集之搜索引擎_3 | 学习笔记
|
SQL 开发框架 安全
Web 信息收集之搜索引擎_1 | 学习笔记
快速学习 Web 信息收集之搜索引擎_1
147 0
Web 信息收集之搜索引擎_1 | 学习笔记
|
网络协议 Ubuntu 安全
Web 信息收集之目标扫描_2 | 学习笔记
快速学习 Web 信息收集之目标扫描_2
170 0
|
SQL 安全 网络协议
Web 信息收集之目标扫描_3 | 学习笔记
快速学习 Web 信息收集之目标扫描_3
166 0
Web 信息收集之目标扫描_3 | 学习笔记
|
XML 安全 网络安全
Web 信息收集之目标扫描_4 | 学习笔记
快速学习 Web 信息收集之目标扫描_4
105 0
Web 信息收集之目标扫描_4 | 学习笔记
|
XML 机器学习/深度学习 网络协议
Web 信息收集之目标扫描_1 | 学习笔记
快速学习 Web 信息收集之目标扫描_1
107 0
Web 信息收集之目标扫描_1 | 学习笔记
|
安全 关系型数据库 MySQL
2 Web站点信息收集
2 Web站点信息收集
2 Web站点信息收集
|
SQL JavaScript PHP
web入门 信息收集
web入门 信息收集WP
209 0
web入门 信息收集