跟我学-域名解析故障排查技巧-阿里云开发者社区

开发者社区> 网络服务专家> 正文

跟我学-域名解析故障排查技巧

简介: 天苍苍,野茫茫,网站一瘫,唯有泪两行!!客户跳,老板叫,解析故障,心惊又肉跳!! 对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象。为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套《域名解析故障排查技巧实操全网最全手册》,并分为“初阶版”“进阶版”,跟我学完保您在排查解析故障方面,脑回路神清晰,分分钟就能定位问题。
+关注继续查看

天苍苍,野茫茫,网站一瘫,唯有泪两行!!
客户跳,老板叫,解析故障,心惊又肉跳!!


6bdbdc3772499db44679d49c0272667a2ba02901.jpeg


2196ba8d1a2aaa17edb55b15462955f202e92d96.jpeg

对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象。为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套《域名解析故障排查技巧实操全网最全手册》,并分为“初阶版”“进阶版”,跟我学完保您在排查解析故障方面,脑回路神清晰,分分钟就能定位问题。为了助您减少客户不可用时间,并赢得老板信任,今天就来听听小编跟大家唠唠域名解析那点事儿。

c90524dd907aacc2964780f01596896b7b99e585.png


因为DNS是互联网流量的入口,所以企业网站一旦发现不可用,运维人员都需要第一时间优先排除是否为域名解析故障导致。其次我们需要知道域名解析故障与网站不能访问是两个概念,因为网站的访问与域名解析、网站服务器、网站备案、网站程序、网路环境等诸多因素都有关联,而本文则重点描述 域名解析故障 排查的方法和思路。

初阶版

多数用户反映的域名解析故障,其实并不一定是真的域名解析出了问题,小编在这里为大家总结了最常见的四种原因,可帮助大家快速定位原因:
第一、 因为域名过期、被锁定都会导致域名无法正常访问。
① 首先我们要知道为什么域名异常会直接导致域名解析异常呢?
因为域名处于域名解析的上游服务,所以递归解析过程中如果域名环节存在异常,权威DNS服务器是接收不到DNS查询请求并完成响应任务的。
② 其次我们要知道域名在什么场景下会导致域名解析异常?

  • 域名过期:一般域名注册商通过修改用户DNS服务器名称,实现访问页面显示域名过期。
  • 域名状态:如果域名处于clienthold、serverhold、inactive三种状态,则代表是因为域名状态异常导致解析异常。

③ 最后我们再加深了解如何定位原因与解决。
阿里云DNS为用户提供了 域名检测工具,可一键查询出域名有效期和域名状态是否存在异常。
_4

  • 域名过期: 域名续费后解析生效时间取决于TTL的设置,一般10分钟后可以在进行解析生效测试。
  • 域名状态:域名状态异常时可参考下图提供的解决方法处理。
    _5

第二、 check备案是否存在异常
首先我们需要知道域名解析和备案实际并无直接关联关系,即使网站出现备案异常,是完全不影响域名解析的设置和解析的生效。而备案异常则会直接影响网站的访问与使用,您可以通过 域名检测工具一键查询备案情况,如备案检查出现异常,即可联系网站服务器供应商定位备案的异常原因并解决。
_6

第三、 check下是否在48小时内修改过域名DNS服务器名称

875645fbe8143fcb0496f93e5c0b897b1a0eda2c.png

修改DNS服务器后,解析生效时间取决于本地DNS中缓存的DNS服务器名称的TTL时间,一般需要24-48小时。所以在修改DNS服务器48小时内,新/旧DNS服务商的解析数据需要保持一致,如果您在原DNS服务商删除了解析记录、或者在新DNS服务商未添加解析记录、或者新/旧DNS服务商添加的解析记录不一致,都有可能导致解析不可用、或者出现站点时而正常时而异常的现象。
结论:如果排查是此情况导致,您可到新/旧DNS服务商操作,最终保持解析数据一致,即可实现快速恢复。

第四、 check解析记录
①检查解析记录的设置是否正确

06d41fa8e30e1e2d31e106e4cbda6764adbc823e.png

建议运维GG们首先可通过 域名检测工具 ,检查下DNS服务商的解析结果,如提示“未检测到该域名设置DNS解析记录”,则建议您检查下解析记录的设置是否正确,例如是未设置该条子域名,还是被“误操作”“不小心”给删除了?还是修改解析记录时输入错误了?总之错误的原因皆有可能,我们首要先排除下因配置原因导致的异常错误。
_9

②检查是否近期刚修改过解析记录。
如果修改了解析记录,需要等待各地的运营商Localdns的缓存到期,域名解析才会生效。一般修改解析后的生效时间取决于域名的TTL设置。您可以通过 域名检测工具 查出TTL生效时间,等待此TTL生效时间后再次检查。
_10

③检查智能解析线路是否未设置默认线路
云解析DNS的智能解析线路,解析优先级是按照“专线”线路、“默认”线路的排序应用,如果访问者来源不属于“专线”线路,而管理员又未设置“默认”线路场景,则会造成此部分用户无法访问站点。
_11
如果以上初步排查后,排查结果都属于正常,那么则可以随小编进入进阶版学习了。

进阶版

在进入进阶版前,要深入了解域名解析异常情况,绕不开的就得先了解域名解析递归流程,很多同学应该还不知道解析的110套路,简单来说就是在递归DNS未有缓存场景下,1次域名解析需要经历10次查询交互。

197ed5816bf10a1e2858b316021cd576251e903d.png


从上面的解析流程介绍我们可以看出,域名解析的过程是经历很多查询交互,任意一环节出现问题都可能会导致解析不生效,所以接下来小编就教教在每个环节如何排查解析异常问题。一般判断解析不生效的定义是DNS查询请求未能查询到域名指向的服务器IP地址或者查询的IP地址与预期不一致。多表现于权威DNS解析结果和递归解析结果/本地DNS解析结果/公共DNS解析结果不一致,或查询结果显示无数据。

第一、排除下权威DNS的解析数据是否存在异常
权威DNS是真正管理域名和IP地址映射关系的DNS服务器,阿里云提供的云解析DNS就是权威DNS,所以第一步,小编教您优先检查权威DNS的解析数据是否存在异常。
域名检测工具,重点查看DNS服务商解析结果,见下图。
_13
① 检查解析结果和您在DNS服务商控制台处设置的解析记录对比是否一致,如一致代表权威DNS解析是正常生效的。
② DNS服务商解析结果显示DNS未设置解析记录,则需要检查您是否为忘记设置或误操作过删除等行为。
③ 检查结果和您在DNS服务商控制台设置的解析记录不一致,此种场景则需要联系您的DNS服务商进行解析数据刷新处理。

第二、排除下是否属于用户本地DNS服务器问题
本地域名服务器是响应来自客户端的递归请求,并最终跟踪直到获取到解析结果的DNS服务器。例如用户本机自动分配的DNS、运营商ISP分配的DNS,我们也可称之为递归DNS。
域名检测工具,在本地DNS检查模块下载客户端查询工具。
_14
用本地DNS工具检测结果如下:
_15
如果确认权威DNS解析是正确的情况下,发现本地DNS解析结果与权威DNS结果不一致,则代表域名解析是在用户本地没有生效。那么为什么会出现本地解析没有生效呢?
主要有下列几种情况:
① 本地DNS服务器上的缓存信息未到期导致。 ->此场景,只需要等待本地DNS解析处显示的TTL生效时间到期后,再次尝试测试即可。
② 如果本地DNS解析TTL过期后测试,仍然和权威DNS解析结果不一致,尝试检查公共DNS解析结果是否一致。
③ 如果公共DNS解析结果和权威解析结果一致,说明权威DNS和公共DNS上解析数据都是生效的,那么可以判断为是用户本地DNS未生效,此种情况建议刷新本地DNS服务器后再进行测试、或将本地DNS服务器修改为公共DNS服务器。
_16

e2e69bb5b070b7c15784dc9e23fa2834719bec78.png


放心放心,小编为了让您能加深了解和记忆,早已为您精心绘制了精简版的Check List,一表在手,让我们帮您把排查解析异常故障的时间“打下来”。
_18
第三、排除下是否为域名被阻断导致域名解析异常
_19
①通过 域名检测工具 ,如递归解析追踪报错“域名递归解析过程被污染“。
一般是域名正常解析过程中受到上级网络设施强行阻断,这已超出权威DNS服务能力, 如果遇到此情况,小编也很遗憾不能给予更好的解决办法,一般建议用户更换业务域名。
_20
②判断递归解析过程哪个环节被“污染”
您也可以通过命令dig+trace测试,本地DNS向根DNS服务器查询时,直接返回了IP地址,则一般可判断为在DNS查询在根DNS服务器处就被阻断。

9a7920f484b40631da959b5035002d823388c925.png

这次的分享就先到这里了,最后,希望小编为大家总结的《域名解析故障排查技巧实操全网最全手册》,能够有效帮助到您快速定位解析异常原因和降低业务不可用时间。

20aa86fbbdfd97cde81008132850e84b67d56e69.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
上传文件 流解析request.getInputStream()
引用:http://blog.sina.com.cn/s/blog_48a6d7ba0100uft7.html ---------------------------------------------------------------------------------------------...
641 0
四个层面解析阿里云云市场生态建设之路
本文讲的是四个层面解析阿里云云市场生态建设之路【IT168 云计算】如今,提到云计算,已不陌生。从互联网时代到物联网时代,云计算从最初一个抽象的概念发展至今,已然成为人工智能的催化剂。云计算的利好之处服务于各个行业,正因如此,云生态在过去一年,变得愈加丰富多彩,变得愈加复杂和多变。
5485 0
java B2B2C Springboot多租户电子商城系统-Eureka源码解析
Eureka的限流算法类RateLimiter是基于令牌桶算法来实现的,下面看一看令牌桶算法的原理: 需要JAVA Spring Cloud大型企业分布式微服务云构建的B2B2C电子商务平台源码 一零三八七七四六二六 对于很多应用场景来说,除了要求能够限制数据的平均传输速率外,还要求允许某种程度的突发传输。
1121 0
ecs内域名无法解析的排查记录
问题现象 ping curl  wget 都无法获取域名解析 host  dig 正常 排查过程&解决方法 检查/etc/resolve.conf   /etc/nsswitch.
2657 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10452 0
阿里云服务器机型这么多怎么选择?各规格族应用场景解析
云服务器具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。
233 0
域名年龄对SEO的影响,域名续费时间长短对排名有影响吗?
域名年龄和注册时长在SEO中是否重要? 我在网上看到了一些关于域名年龄和域名续费时长影响搜索排名的意见分歧。许多SEO认为域名年龄和注册时长都会影响搜索引擎排名。我是他们其中的一员。这场辩论已持续多年,因为百度在一轮谈判中表示它不会影响排名。
1114 0
54
文章
4
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载