Google应该这样玩,你知道这些技巧吗?

简介: 网络让世界变成了“地球村”,拉近了世界各地人与人之间的距离;搜索引擎更是让我们在互联网上没有秘密可言,查找网页,查找信息,查找人,我们都离不开它。

黑客可能利用Google去搜索精准敏感的信息并占为己有;创业者可能利用Google去搜索更有用的商业信息;产品经理可以利用Google去抓住用户的痛点;销售可能利用Google去搜索客服的基本信息;而我们当熟悉了Google的搜索技巧后,就能在以后的生活中更好的保护自己的隐私。


说了这么多,不知道小伙伴们之前了解过搜索引擎语法吗?如果你做过搜索引擎(Apache Lucene)开发,肯定会很熟悉这些语法知识的,搜索引擎语法实质上是由搜索引擎领域特定语言DSL(Domain Specific Language)所支持的,只是搜索引擎具体语法的实现又对DSL进行了通俗化处理,毕竟使用搜索引擎的不全是程序员;一般来说,每个搜索引擎都有一些它特殊的语法规则,但是大部分语法规则是一样的。


为什么要掌握这些语法规则呢?主要是它能帮助我们最快最准确的查找到最有用的信息。


接下来,主要以我最喜爱的Google搜索引擎为例,给大家聊聊搜索引擎到底有那些玩法。咱们一起来看看这些语法规则是怎么用的?


1基础知识


在搜索词组和短语时,我们用双引号包裹起来;搜索之前,我们需要提炼出你要搜索的关键字,这样便于搜索引擎能够提供更加准确的信息。


说明:特殊字符与搜索关键之间不能有空格。


AND:用于查询包含多个关键字。


+:强制搜索它后面的词语。


注:如果需要查询包含and的词组,只需把该词组用双引号包裹起来,如“"hot and red"”。


NOT: 与AND操作符相反,表示忽略一个词。


-: 与NOT操作符意义一样。


OR:搜索一个或者另外一个关键字。


|: 与OR操作符意义一样。


注:Google对括号并不“感冒”。


2搜索语法


基本语法如下:

操作符:关键字


3常见操作符


intitle与allintitle


intitle主要用于查询网页顶部显示的文本;allintitle显示的结果更为准确。如:intitle:当乐网


image.png


allintext


在网页内容里查询搜索项。如:allintext:"当乐熊"


image.png


inurl与allinurl


在url中查找关键字。如:inurl:.php?id=


image.png


site


搜索特定的站点。如:site:www.d.cn


image.png



filetype


指定搜索的文件类型。如:filetype:pdf Java编程思想

image.png

link


用于搜索链接到一个网站或者URL的链接。如:link:www.d.cn


image.png


inanchor


在链接的描述文本中查找文本。inanchor:"忆蓉之心"


cache


显示网页的缓存版本。cache:www.d.cn

image.png



注:如果cache传递一个无效的URL或者主机名,google会把它当作一个词组来搜索。


numrange


查找某一范围内的数字。如:numrange:最小数-最大数


daterange


查找某个特定日期范围内发布的网页。如:daterange:儒略历1-儒略历2


注:儒略历计算公式[年(I),月(J),日(K)]


JD=K-32075+1461*(I+4800+ (J-14)/12)/4+367*(J-2-(J-14)/12*12)/12-3*((I+4900+(J-
14)/12)/100)/4


info


显示google的摘要信息。如果传递一个无效的主机名或者url,google会把它当作一个词组来搜索。如:info:www.d.cn


image.png


related


显示相关站点。如果传递一个无效的主机名或者URL,google会把它当做一个词组来搜索。如:related:www.qq.cn


image.png


stocks


搜索股票信息。如:stocks:腾讯


image.png


define


显示某个术语的定义。如:define:windows


image.png

phonebook


搜索电话列表(商业和住宅电话列表),如:phonebook:Jim;还有rphonebook专门搜索住宅电话列表,bphonebook搜索商业电话。



4高级搜索技巧


这些所谓的高级技巧,说白了就是把这些基础的操作符组合在一起快速查找到你想要的内容。因此,我们必须要掌握好这些基础操作符和相应的语法知识,才能打出漂亮的“组合拳”,快速查找到你想要的信息;下面咱们结合两个例子来说明。


查找目录与文档,如下:

intitle:index.of inurl:admin
intitle:index.of ws_ftp.log
intitle:index.of "server at"
intitle:index.of  filetype:bak
inurl:conf or inurl:config or inurl:cfg
filetype:log username
filetype:xls username password email

查找后台登录与数据库,如下:

inurl:/admin/login
allinurl:admin mdb
intitle:"Web Data Administrator - Login"  # MS SQL登录
intitle:"Gateway Configuration Menu" # Oracle
inurl:pls/admin_/gateway.htm # Oracle 登录入口
inurl:"main.php" "phpMyAdmin" "running on" # phpMyAdmin
intitle:index.of config.php



5总结


在此,就不列举太多的技巧,更多的技巧需要你对Google语法的掌握程度和实际环境来获得。比如大家可以去参考《通过Google挖掘细分市场的一个案例》这篇文章,利用学到Google语法知识尝试者去挖掘出更有意思的东西。



相关文章
|
定位技术 API
百度地图开发:阻塞加载慢A parser-blocking, cross site的解决方案
百度地图开发:阻塞加载慢A parser-blocking, cross site的解决方案
967 0
|
机器学习/深度学习 算法 数据库
KNN和SVM实现对LFW人像图像数据集的分类应用
KNN和SVM实现对LFW人像图像数据集的分类应用
335 0
|
11月前
|
传感器 人工智能 自然语言处理
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
RDT(Robotics Diffusion Transformer)是由清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能够在无需人类操控的情况下自主完成复杂任务,如调酒和遛狗。
706 22
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
|
11月前
|
算法
基于PSO粒子群优化的配电网可靠性指标matlab仿真
本程序基于PSO粒子群优化算法,对配电网的可靠性指标(SAIFI、SAIDI、CAIDI、ENS)进行MATLAB仿真优化。通过调整电网结构和设备配置,最小化停电频率和时长,提高供电连续性和稳定性。程序在MATLAB 2022A版本上运行,展示了优化前后指标的变化。PSO算法模拟鸟群行为,每个粒子代表一个潜在解决方案,通过迭代搜索全局最优解,实现配电网的高效优化设计。
317 15
|
存储 弹性计算 数据管理
阿里云对象存储OSS怎么收费?存储包流量包还是按量?
阿里云对象存储OSS收费有两种计费模式,即包年包月和按量付费,包年包月是指购买存储包、流量包来抵扣OSS产生的存储费核流量费,OSS标准(LRS)存储包100GB优惠价33元、500GB存储包半年162元、OSS存储包40GB一年9元,OSS流量包100G 49元/月
8805 2
阿里云对象存储OSS怎么收费?存储包流量包还是按量?
|
SQL Java 数据库连接
深入理解SQL中的LEFT JOIN操作
深入理解SQL中的LEFT JOIN操作
|
Java 应用服务中间件 微服务
spring boot 中Feign调用提示Request header is too large 解决方案
spring boot 中Feign调用提示Request header is too large 解决方案
973 1
|
机器学习/深度学习 数据采集 搜索推荐
风险评分与生存时间:解密高风险组的潜在命运!
风险评分与生存时间:解密高风险组的潜在命运!
498 0
|
人工智能 自然语言处理 API
万媒易发:以RPA自动化和AIGC为基础实现多平台分发
在当今数字化时代,信息传播的速度越来越快,多平台分发成为了内容创作者们必须面对的重要挑战之一。为了解决这一难题,我们可以借助RPA(Robotic Process Automation)自动化和AIGC(Artificial Intelligence Generated Content)技术,实现高效的多平台内容发布。本文将介绍如何利用“万媒易发”工具来简化这一过程,提高内容分发的效率。
|
敏捷开发 传感器 机器学习/深度学习
阿里妈妈智造字,全新可变字体再发布
万变的时代,研发可变的字体。阿里妈妈智造字继发布数黑体、数智体、东方大楷后再次发布3款字:书法体——阿里妈妈刀隶体,可变体——阿里妈妈方圆体、阿里妈妈灵动体(alimama agile)。01从多到一,以AI孵化可变字体-可变字体作为屏显时代科技与设计艺术结合的产物,阿里妈妈妈智造字研究并拓展其设计形态的表达与应用,挖掘屏显时代字体设计的巨大潜力,满足受众不断变化的阅读需求。可变技术带来的字体设计
22866 1
阿里妈妈智造字,全新可变字体再发布