Hello 各位好,我是小豪。看了公众号「我是陈大壮」的作者陈怀哲老师写的一篇文章《如何让网站被谷歌和必应收录》,这个话题正好是我在工作中有时会接触到的,里面提到了网站运营中经常会用到的一些术语:
- 站点地图 sitemap
- 站长工具
看完我觉得非常有价值,也很受启发,因此我也想把文章提到的东西,在自己的个人博客上试验一下,毕竟看完不去实践,相当于没看。。。我的个人博客是基于 Hexo 框架搭建的,买的不是顶级域名 .com
,一直以来有个困惑,为啥在百度搜不到我在博客上发的文章呢?用 site 命令查了一下,可怜到只显示 3 条结果,原因是:百度都没收录我发的东西,咋会在搜索结果中显示文章呢?纯粹是自作多情了。反正百度我是整不会了,还是整回 Google 和必应搜索吧。使用相同的 site 命令在 Google 进行搜索,返回的第 1 个结果是「尝试使用 Google Search Console」。说实话,第一次见这玩意,还不知道是啥东西,但昨晚看了陈怀哲老师写的文章,才知道原来这玩意就叫 Google 站长工具。
Google Search Console 是什么?
解释概念不是我的专长,还是直接来看 Google 官方给出的介绍吧:简言之,Google 站长工具可以给我们提供网站在搜索引擎中的表现(数据),例如网站点击次数、曝光次数、用户地区分布、用户访问设备的占比、页面点击数等,给出的数据还挺全的。
谁应该使用 Google 站长工具?
对于这个问题,Search Console 帮助文档也给出了一些建议:我之所以要用 Google 站长工具,是因为从 2020 年建立博客以来,我对自己的博客其实是不够了解的,具体表现在:
- 我不清楚到底有多少人访问了我的博客
- 不清楚博客上哪些文章比较受欢迎
- 不清楚一口气租了 3 年的云服务器,给我带来的价值在哪
而现在有了这工具,就能解决前面的两个问题了,Nice!
Google 站长工具的简单配置
在初次使用 Google 站长工具时,需要进行简单的验证,以确认你对输入的网站拥有归属权。Google 站长工具提供了几种验证方式,我选择的是其中的 DNS 解析验证,这就要求我们在域名的 DNS 解析中增加一条记录。添加 DNS 解析记录时,可参考下面的配置:
- 主机记录:@
- 记录类型:TXT
- 记录值:Google 站长工具提供的验证信息
在内容收录方面,虽然 Google 比国内的百度更友好,但自己的博客毕竟是小网站,为了有机会被更多的人搜到,还可以像开头的文章《如何让网站被谷歌和必应收录》提到的,主动向搜索引擎提交网站的站点地图。
站点地图 sitemap
来自 Google 搜索中心文档对站点地图的定义:
站点地图是一种文件,您可以在其中提供与您网站中的网页、视频或其他文件有关的信息,还可以说明这些内容之间的关系。Google 等搜索引擎会读取此文件,以便 更高效地抓取您的网站。
简单来说,主动向搜索引擎提交我们网站的站点地图,是为了让搜索引擎派出的「蜘蛛」更好地抓取网站的内容,方便「蜘蛛」,就是方便自己。在哪些情况下,你的网站需要站点地图呢?同样摘录一段来自 Google 搜索中心文档的内容:将站点地图提交给 Google,有 2 种方式:
- 将其添加到
robots.txt
文件中 - 将其直接提交给 Search Console
这里我们采用第 2 种方式,通过 Google 站长工具提交站点地图。但在提交之前,还需要确保我们的网站已经生成了站点地图文件。Google 支持多种站点地图格式:
- XML
- RSS、mRSS 和 Atom 1.0
- 文本
这里我们选择 XML 格式。
Hexo 博客生成 XML 格式站点地图
需要说明的是,不同的博客框架生成站点地图的方式略有区别,具体生成方式取决于博客使用的框架。我的博客基于 Hexo 框架搭建,因此这里只介绍 Hexo 博客生成 XML 格式站点地图的方法:打开电脑上的终端或 cmd,进入到 Hexo 博客的根目录,粘贴下面的命令并按下回车键。
npm install hexo-generator-sitemap --save
完成安装后,打开 Hexo 根目录下的配置文件 _config.yml
,在 url 的位置填入网站的域名,之后保存文件,将更改提交到服务器。稍等一小会,在博客网址的末尾加上后缀 /sitemap.xml
,如果返回了类似下图的内容,就说明站点地图文件已经顺利生成啦!将当前的网址链接粘贴到 Google 站长工具后台的「站点地图」中,就完成了站点地图的提交。不过我早上提交的站点地图还存在一些问题,因此目前显示的「状态」为「无法获取」,这……等过几天再看看吧。
以上,就是本次想和你分享的内容。