加入多级缓存
对于高并发读多写少的场景,加入缓存几乎就是标配。
DNS也不例外,它加了缓存,而且不止一层。
从在浏览器的搜索框中输入URL。它会先后访问浏览器缓存 、操作系统的缓存/etc/hosts
、最近的DNS服务器缓存 。如果都找不到,才是到根域,顶级(一级)域,二级域等DNS服务器进行查询请求。
加入缓存后的DNS查询顺序
于是请求过程就成了下图这样。可以看到上面提到的好几有缓存的地方我都加了个绿色的小文件图标,优先在缓存里做查询。
加入缓存后的DNS查询过程
由于缓存了上面树状结构的信息,最近的DNS服务器也不再需要每次都从根域 开始查起。比如在缓存里能找到baidu.com
的服务器IP,就直接跳到二级域服务器上做查找就好了。
正因为多级缓存的存在,每一层实际接收到的请求都大大减少了。并且每个人日常访问的网站也就那么几个,所以大部分时候都能命中缓存直接返回IP地址。
简单小结下。
DNS的设计中,通过层次结构将服务进行拆分 ,流量分散到多个服务器中。
又通过加入多级缓存 ,让每个层级实际接收到的请求大大减少,因此大大提高了系统的性能。
这两点 ,是我们做业务开发的过程中可以参考的优秀设计。
但还有一点 ,是我们大概率学不来的,叫任播 ,它也为DNS实现高并发处理能力提供了重要支持,我会把它放到放到下一篇文章展开聊聊。
协议格式
DNS是个域名解析系统,而运行在这套系统上的协议,就叫DNS协议 。
和HTTP类似,DNS协议也是个应用层协议 。
DNS是应用层协议
下图是它的报文格式。
DNS报文
字段太多,很晕?这就对了。
我们就挑几个重点的说说。
Transsaction ID 是事务ID,对于一次请求 和这个请求对应的应答 ,他们的事务ID是一样的,类似于微服务系统中的log_id
。
flag字段 是指标志位,有2个Byte,16个bit
,需要关注的是QR
,OpCode
, RCode
。
- • QR 用来标志这是个查询还是响应报文,0是查询,1是响应。
- • OpCode 用来标志操作码,正常查询都是0,不管是域名查ip,还是ip查域名,都属于正常查询 。可以粗暴的认为我们平时只会看到
0
。 - • RCode 是响应码,类似于HTTP里的
404, 502
这样的status code
。用来表示这次请求的结果是否正常。0是指一切正常。1是指报文格式错误,2服务域名服务器内部错误。
Queries 字段,是指你实际查询的内容。这里其实包含三部分信息,Name
, Type
, Class
。
查询的内容分成三部分信息
- • Name 可以放域名或者IP。比如你要查的是
baidu.com
这个域名对应的IP,那里面放的就是域名 ,反过来通过IP查对应的域名,那Name
字段里放的就是IP 。 - • Type 是指你想查哪种信息,比如你想查这个域名对应的IP地址是什么,那就是填A(address),如果你想查这个域名有没有其他别名,就填CNAME(Canonical Name)。如果你想查 xiaobaidebug@gmail.com对应的邮箱服务器地址是什么(比如 gmail.com),那就填MX(Mail Exchanger)。除此之外还有很多类型,下面是常见的Type表格。
- • Class字段就比较有意思了,你可以简单的认为,我们只会看到它填
IN
(Internet
)。其实DNS协议本来设计出来是考虑到可能会有更多的应用场景的,比如这里还能填CH
,HS
。大家甚至都不需要知道它们是什么含义,因为随着时间的发展,这些都已经成化石了,我们知道这个字段的唯一作用,可能 就是可以在面试的时候可以随意装个x,深藏功与名。
Answers 字段,从名字可以看出,跟Queries对应,一问一答 。作用是返回查询结果,比如通过域名查对应的IP地址,这个字段里就会放入具体的IP信息。
抓包
原理看完了,来抓个包吧。
我们打开wireshark
。然后执行
dig www.baidu.com
此时操作系统会发出DNS请求,查询 www.baidu.com
对应的IP地址。
DNS_Query
上面的图里是DNS查询(request
)的内容,可以看到它是应用层的协议,传输层用的是UDP协议 进行数据传输。截图里标红的部分,也就是上面提到的需要重点关注的报文字段内容。其中flag
字段是按bit
展示的,因此抓包里进行了分行展示。
接下来再看下响应(response
)的数据包内容。
DNS_Response
可以看到事务ID (Transaction ID)跟DNS请求 报文是一致的。并且Answers字段里带有两个IP地址。试了下,两个IP地址都是可以正常访问的。
总结
- • DNS是非常优秀的高并发分布式系统,通过层次结构将服务进行拆分 ,流量分散到多个服务器中。又通过加入多级缓存 ,让每个层级实际接收到的缓存大大减小,因此大大提高了系统的性能。这两点在做业务开发的过程中是可以借鉴的。
- • 插上网线通网时,本机通过DHCP协议获得DNS服务器的地址。
- • 根域服务器的IP会以配置的形式加载到每一台DNS服务器当中。因此访问任意一台DNS服务器都能轻松找到根域对应的IP地址。
最后
最后给大家留下两个问题。
DNS基于UDP协议
- • 从抓包可以看出,DNS在传输层上使用了UDP协议,那它只用UDP吗?
- • 上面提到,DNS的IPV4根域名 只有
13个
,这里面其实有不少都部署在漂亮国,那是不是意味着,只要他们不高兴了,切断我们的访问,我们的网络就得瘫痪了呢?