概述
DNS 是互联网核心协议之一。不管是上网浏览,还是编程开发,都需要了解一点它的知识。
本文详细介绍 DNS 的原理,以及如何运用工具软件观察它的运作。我的目标是,读完此文后,你就能完全理解 DNS。
一、DNS 是什么?
DNS(Domain Name System 的缩写)的作用非常简单,就是根据域名查出IP地址。你可以把它想象成一本巨大的电话本。
举例来说,如果你要访问域名 math.stackexchange.com,首先要通过 DNS 查出它的IP地址是 151.101.129.69。
如果你不清楚为什么一定要查出IP地址,才能进行网络通信,建议先阅读我写的 《互联网协议入门》[1]。
二、查询过程
虽然只需要返回一个IP地址,但是 DNS 的查询过程非常复杂,分成多个步骤。
工具软件 dig 可以显示整个查询过程。
上面的命令会输出 6 段信息。
如果不想看到这么多内容,可以使用 +short 参数
上面命令只返回 math.stackexchange.com 对应的 4 个 IP 地址(即A记录)。
三、DNS服务器
下面我们根据前面这个例子,一步步还原,本机到底怎么得到域名 math.stackexchange.com 的IP地址。
首先,本机一定要知道 DNS 服务器的IP地址,否则上不了网。通过DNS服务器,才能知道某个域名的IP地址到底是什么。
查看 DNS 服务器配置
DNS 服务器的IP地址,有可能是动态的,每次上网时由网关分配,这叫做 DHCP 机制;也有可能是事先指定的固定地址。 Linux系统里面,DNS 服务器的 IP 地址保存在 /etc/resolv.conf 文件。
上例的 DNS 服务器是 192.168.1.253,这是一个内网地址。有一些公网的DNS服务器,也可以使用,其中最有名的就是 Google 的 8.8.8.8 和 Level 3 的 4.2.2.2。
本机只向自己的 DNS 服务器查询,dig 命令有一个@参数,显示向其他 DNS 服务器查询的结果。
上面命令指定向 DNS 服务器 4.2.2.2 查询。
四、域名的层级
DNS 服务器怎么会知道每个域名的 IP 地址呢?答案是分级查询。
请仔细看前面的例子,每个域名的尾部都多了一个点。
比如,域名 math.stackexchange.com 显示为 math.stackexchange.com.。这不是疏忽,而是所有域名的尾部,实际上都有一个根域名。
举例来说,www.example.com 真正的域名是 www.example.com.root ,简写为 www.example.com. 。因为,根域名.root 对于所有域名都是一样的, 所以平时是省略的。
根域名的下一级,叫做 顶级域名(top-level domain,缩写为 TLD),比如 .com、.net;再下一级叫做 次级域名(second-level domain,缩写为 SLD), 比如 www.example.com 里面的 .example,这一级域名是用户可以注册的;再下一级是 主机名(host),比如 www.example.com 里面的 www,又称为 三级域名, 这是用户在自己的域里面为服务器分配的名称,是用户可以任意分配的。
总结一下,域名的层级结构如下。
主机名.次级域名.顶级域名.根域名
五、根域名服务器
DNS 服务器根据域名的层级,进行分级查询。
需要明确的是,每一级域名都有自己的 NS 记录,NS 记录指向该级域名的域名服务器。这些服务器知道下一级域名的各种记录。
所谓 分级查询,就是从根域名开始,依次查询每一级域名的 NS 记录,直到查到最终的 IP 地址,过程大致如下。
1. 从 "根域名服务器" 查到 "顶级域名服务器"的 NS 记录和 A 记录(IP 地址)
2. 从 "顶级域名服务器" 查到 "次级域名服务器"的 NS 记录和 A 记录(IP 地址)
3. 从 "次级域名服务器" 查到 "主机名"的 IP 地址
仔细看上面的过程,你可能发现了,没有提到 DNS 服务器怎么知道 "根域名服务器" 的 IP 地址。 回答是 "根域名服务器" 的 NS 记录和 IP 地址一般是不会变化的, 所以内置在 DNS 服务器里面。
下面是内置的根域名服务器 IP 地址的一个 例子 [2]
上面列表中,列出了根域名(.root)的三条 NS 记录 A.ROOT-SERVERS.NET、B.ROOT-SERVERS.NET 和 C.ROOT-SERVERS.NET, 以及它们的 IP 地址(即 A 记录)198.41.0.4、192.228.79.201、192.33.4.12。
另外,可以看到所有记录的 TTL 值是 3600000 秒,相当于 1000 小时。也就是说,每 1000 小时才查询一次根域名服务器的列表。
目前,世界上一共有 13 组根域名服务器,从 A.ROOT-SERVERS.NET 一直到 M.ROOT-SERVERS.NET。
六、分级查询的实例
dig 命令的 +trace 参数可以显示 DNS 的整个分级查询过程。
上面命令的第一段列出根域名.的所有 NS 记录,即所有根域名服务器。
根据内置的根域名服务器 IP 地址,DNS 服务器向所有这些 IP 地址发出查询请求,询问 math.stackexchange.com 的顶级域名服务器 com.的 NS 记录。 最先回复的根域名服务器将被缓存,以后只向这台服务器发请求。
接着是第二段。
上面结果显示.com 域名的 13 条 NS 记录,同时返回的还有每一条记录对应的 IP 地址。
然后,DNS 服务器向这些顶级域名服务器发出查询请求,询问 math.stackexchange.com 的次级域名 stackexchange.com 的 NS 记录。
上面结果显示 stackexchange.com 有四条 NS 记录,同时返回的还有每一条 NS 记录对应的 IP 地址。
然后,DNS 服务器向上面这四台 NS 服务器查询 math.stackexchange.com 的主机名。
上面结果显示,math.stackexchange.com 有 4 条 A 记录,即这四个 IP 地址都可以访问到网站。并且还显示, 最先返回结果的 NS 服务器是 ns-cloud-d2.googledomains.com,IP 地址为 216.239.34.109。
七、NS 记录的查询
dig 命令可以单独查看每一级域名的 NS 记录。
+short 参数可以显示简化的结果
八、DNS 的记录类型
域名与 IP 之间的对应关系,称为 "记录"(record)。根据使用场景,"记录"可以分成不同的类型(type),前面已经看到了有 A 记录和 NS 记录。
常见的 DNS 记录类型如下。
- • A:地址记录(Address),返回域名指向的 IP 地址。
- • AAAA: 记录是域名到 IPV6 地址。
- • NS:域名服务器记录(Name Server),返回保存下一级域名信息的服务器地址。该记录只能设置为域名,不能设置为 IP 地址。
- • MX:邮件记录(Mail eXchange),返回接收电子邮件的服务器地址。
- • CNAME:规范名称记录(Canonical Name),返回另一个域名,即当前查询的域名是另一个域名的跳转,详见下文。
- • PTR:逆向查询记录(Pointer Record),只用于从 IP 地址查询域名,详见下文。
一般来说,为了服务的安全可靠,至少应该有两条 NS 记录,而 A 记录和 MX 记录也可以有多条,这样就提供了服务的冗余性,防止出现单点失败。
CNAME 记录主要用于域名的内部跳转,为服务器配置提供灵活性,用户感知不到。举例来说,facebook.github.io 这个域名就是一个 CNAME 记录。
上面结果显示,facebook.github.io 的 CNAME 记录指向 github.map.fastly.net。也就是说,用户查询 facebook.github.io 的时候, 实际上返回的是 github.map.fastly.net 的 IP 地址。这样的好处是,变更服务器 IP 地址的时候,只要修改 github.map.fastly.net 这个域名就可以了, 用户的 facebook.github.io 域名不用修改。
由于 CNAME 记录就是一个替换,所以域名一旦设置 CNAME 记录以后,就不能再设置其他记录了(比如 A 记录和 MX 记录),这是为了防止产生冲突。 举例来说,foo.com 指向 bar.com,而两个域名各有自己的 MX 记录,如果两者不一致,就会产生问题。由于顶级域名通常要设置 MX 记录, 所以一般不允许用户对顶级域名设置 CNAME 记录。
PTR 记录用于从 IP 地址反查域名。dig 命令的 -x 参数用于查询 PTR 记录。
上面结果显示,192.30.252.153 这台服务器的域名是 pages.github.com。
逆向查询的一个应用,是可以防止垃圾邮件,即验证发送邮件的 IP 地址,是否真的有它所声称的域名。
dig 命令可以查看指定的记录类型。
九、其他 DNS 工具
除了 dig,还有一些其他小工具也可以使用。
(1)host 命令
host 命令可以看作 dig 命令的简化版本,返回当前请求域名的各种记录。
host 命令也可以用于逆向查询,即从 IP 地址查询域名,等同于 dig -x 。
(2)nslookup 命令
nslookup 命令用于互动式地查询域名记录。
(3)whois 命令
whois 命令用来查看域名的注册情况。
十、参考链接
- • DNS: The Good Parts, by Pete Keen[3]
- • DNS 101, by Mark McDonnell[4]
转载声明
本文转载自 DNS 原理入门[5],笔者在文字描述和图片排版上略作修改。
小结
下面是笔者补充的部分,简述下 DNS 的流程。
图片来源: https://aws.amazon.com/cn/route53/what-is-dns/
- • 浏览器输入域名,如 www.example.com
- • 查询当前硬件的缓存(host 文件 或浏览器缓存)中是否存在该域名对应的记录,如果存在直接使用,如果不存在则进入后续流程
- • 向运营商的 DNS 服务器发起 DNS 解析的请求,一般称运营商的 DNS 服务器为 Local DNS
- • Local DNS 会查询缓存记录 (内部实现对请求端来说是透明的)
- • Local DNS 如果没有缓存,会把域名从右往左扫描,依次请求对应的服务器
- • 对于域名 www.example.com,先去请求根域名服务器,假设根域名服务器返回了管理 .com 域的服务器,名字为 TLD
- • Local DNS 请求管理 TLD 服务器
- • 一般来说,TLD 返回的记录是一条 CNAME 记录,这里假设域名的 CNAME 解析到了 Amazon
- • Local DNS 请求 Amazon 的 DNS 服务器 (一般称之为权威服务器,权威服务器是 Amazon 自己构建的)
- • Amazon 返回 www.example.com 对应的服务器 IP 地址
- • Local DNS 缓存这个 IP 地址,并且返回给浏览器
- • 浏览器和返回的 IP 地址建立 TCP 连接,发送 HTTP 报文
如何自建 DNS 服务器
- • 在自己的服务器上 (例如 10.0.0.1) 构建一个 DNS 服务 (可以理解为一个软件,支持 DNS 协议,就像 Nginx 支持 HTTP 协议)
- • 在域名系统管理后台,新增一条 CNAME 记录,将域名的解析转交给 10.0.0.1
- • 10.0.0.1 可以自定义返回各个域名对应的 IP 地址,实现自定义 DNS 服务器
扩展阅读
- • 为什么 DNS 同时使用 TCP 和 UDP[6]
- • what-is-dns[7]
引用链接
[1] 《互联网协议入门》: https://www.ruanyifeng.com/blog/2012/05/internet_protocol_suite_part_i.html
[2] 例子 : http://www.cyberciti.biz/faq/unix-linux-update-root-hints-data-file/
[3] DNS: The Good Parts, by Pete Keen: https://www.petekeen.net/dns-the-good-parts
[4] DNS 101, by Mark McDonnell: http://www.integralist.co.uk/posts/dnsbasics.html
[5] DNS 原理入门: http://www.ruanyifeng.com/blog/2016/06/dns.html
[6] 为什么 DNS 同时使用 TCP 和 UDP: https://scoolor.github.io/2018/11/10/dns-udp-tcp/
[7] what-is-dns: https://www.cloudflare.com/zh-cn/learning/dns/what-is-dns/