【51CTO独家特稿】编者按:在大众网,智能DNS被用在绝大部分二级域名和一些非大众网域名上,一年多来运行的相当稳定。晓辉本次总结了过去一年来部署使用智能DNS过程中的操作步骤和一些经验心得,跟大家分享。
去年因为二级域名大量增加、Bind下管理不便的关系,在公司部署了智能DNS(Bind dlz),当时写过一篇部署文档进行了记录。不过在过去一年的使用当中,发现了其中不少的错误,所以本次发布该文档的第二版,对这些错误进行修正。更新内容包括:
1、修正web界面中对新建域名ns 域名是自身的严重bug。
2、修正web界面中线路为 电信 网通 移动。
3、取消A、CNAME、MX、AAAA记录最多只能添加10条的限制。
4、修正IP库到最新。
5、使用CentOS 5.7版本。
智能dns工作示意图
一、Bind-dlz简介
全世界范围内标准DNS服务器是BIND。尽管被流传了许多年,经过多次修改,BIND的基本功能保持不变。遗憾的是,有一些不好的缺陷。
- BIND从文本文件中获取数据,这样容易因为编辑错误出现问题。
- BIND需要将数据加载到内存中,如果域或者记录较多,会消耗大量的内存。
- BIND启动时解析Zone文件,对于一个记录较多的DNS来说,会耽误更多的时间。
- 如果最近修改一条记录,那么要重新加载或者重启BIND才能生效,可能会影响客户端查询。
bind-dlz主要解决上述缺陷而诞生,在mysql存储zone的记录,比在文本中好管理的多。
智能DNS的原理:
在用户解析一个域名的时候,判断一下用户的IP,然后跟DNS服务器内部的IP表匹配一下,看看用户是电信还是网通用户,然后给用户返回对应的IP地址。
适用范围:
网站要有三线路接入或者在电信、联通、移动部署有服务器,这样智能dns才能派上用场。
二、智能DNS系统服务规划
1、NameServer服务器设置(到新网或者万网后台添加)
ns1.zjyxh.com 192.19.13.15 ns2.zjyxh.com 192.19.11.3
NS1是master ,NS2是slave。两者数据通过mysql来同步。
2、测试NS记录是否生效
#dig ns www.zjyxh.com #dig www.zjyxh.com +trace
3、Bind-View规划
www.zjyxh.com 网通 (CNC) 124.133.11.78 www.zjyxh.com 电信(TELECOM) 58.56.11.153 www.zjyxh.com 移动(ANY) 120.192.11.13
三、在CentOS 5.7上安装MySQL Replication
因为Bind-dlz是使用MySQL作为存储zone的载体,这样就可以用php来操作MySQL。特别注意:智能dns最少部署两台NameServer,主从关系。主从同步利用mysql的复制来实现主从同步。
首先下载mysql的最新版并解压:
wget http://mirrors.sohu.com/mysql/MySQL-5.1/mysql-5.1.60.tar.gz tar zxf mysql-5.1.60.tar.gz cd mysql-5.1.60 ./configure --prefix=/usr/local/mysql --enable-assembler --with-server-suffix=-DZWWW --enable-thread-safe-client --enable-local-infile --enable-thread-safe-client --with-big-tables --with-charset=utf8 --with-client-ldflags=-all-static -with-collation=utf8_general_ci --with-extra-charsets=all --with-mysqld-ldflags=-all-static --with-mysqld-ldflags=-ltcmalloc --with-mysqld-user=mysql -with-plugins=partition,myisammrg --with-pthread --with-unix-socket-path=/tmp/mysql.sock --without-ndb-debug make && make install
将my.cnf放到/etc下,并安装系统数据库。
wget http://autolemp.googlecode.com/files/my.cnf cp support-*/mysql.server /etc/init.d/mysqld cp my.cnf /etc/ chmod 744 /etc/init.d/mysqld cd /usr/local/mysql chown -R mysql:mysql . rm -rf sql-bench mysql-test mkdir -p /data0/mysql/relaylog/ mkdir -p /data0/mysql/binlog/ chown -R mysql.mysql /data0/mysql /usr/local/mysql/bin/mysql_install_db --user=mysql --basedir=/usr/local/mysql --datadir=/data0/mysql/data
默认脚本会启动MySQL。如果报错,会在数据库目录里有错误日志。
MySQL replication配置
1、MySQL安全设置
* 用mysqladmin命令来改root用户口令
# mysqladmin -uroot password 51cto.com
//设置MySQL管理操作用户root的密码为51cto.com
* 用setpassword修改口令:
mysql> set password for root@localhost=password('51cto.com);
* 直接修改user表的root用户口令
mysql> use mysql; mysql> update user set password=password('51cto.com') where user='root'; mysql> flush privileges;
2、删除默认的数据库和用户。
我们的数据库是在本地,并且也只需要本地的php脚本对mysql进行读取,所以很多用户都不需要。mysql初始化后会自动生成空用户和test库,这会对数据库构成威胁,我们全部删除。
mysql> drop database test; mysql> use mysql; mysql> delete from db;
mysql> delete from user where not(host="localhost" anduser="root");
mysql> flush privileges;
3、Master 机器设置权限,赋予Slave机器FILE及Replication Slave权利,并打包要同步的数据库结构。
Master# ./mysql -u root -p 51cto.com Enter password: Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 2 to server version: 5.1.60 Type 'help;'or '\h' for help. Type '\c' to clear the buffer. mysql> GRANT FILE ON*.* TO slaverep@172.19.1.3 IDENTIFIEDBY ‘slaverep’; mysql> GRANT REPLICATION SLAVE ON *.* TO slaverep@172.19.1.3 IDENTIFIEDBY ‘51cto.com’; mysql> Flush privilege;
赋予192.19.11.3也就是Slave 机器有File权限, 这个5.1.60版对replication的权限好像做了调整,只赋予Slave机器有File权限还不行,还要给它REPLICATION SLAVE的权限才可以。
Master 导入CDN。Sql文件建立CDN数据结构
# mysql -uroot -p 51cto.com mysql> create database cdn; mysql> \q # mysql cdn -uroot -p 51cto.com < cdn.sql #cdn.sql文件所在的位置
这样master 就有了CDN库的数据结构。
Slave一样。这样不再重复。
然后,设置主服务器Master的my.cnf,启动Mysql服务
Master# vi /etc/my.cnf
在[mysqld]添加或修改以下的内容:
[mysqld] log-bin=/home/data/mysql/data/binlog/binlog #打开logbin选项以能写到slave的 I/O线程; server-id=1 #表示是本机的序号为1,一般来讲就是master的意思. binlog-do-db=cdn #表示同步cdn数据库;
然后把Master主服务器的MySQL重启。
Master# service mysqld restart
4、修改Slave服务器的my.cnf
Slave# vi /etc/my.cnf
在[mysqld]添加或修改以下的内容:
[mysqld] master-host=192.19.13.15 master-user=slaverep master-password=51cto.com master-port=3306 server-id=10 master-connect-retry=60 replicate-do-db=cdn [要更新的数据库] log-slave-updates
5、删除Slave端数据库目录中的master.info
Slave# rm -f master.info
6、重启动Slave的MySQL服务。
Slave# service mysqld restart
7、测试
先检测两个MySQL数据库中的cdn是否正常。正常情况应该是Master和Slave 中的MySQL都有相同的cdn数据库,并且里面的数据都一样。然后测试replication功能是否起用。在Master中的reptest数据库添加一笔数据:
Master# mysql -u root -p Enter password: Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 12 to server version: 5.1.60 Type 'help;'or '\h' for help. Type '\c' to clear the buffer. mysql> use cdn; Database changed mysql> INSERT INTO rep_table VALUES ('test1', '4321', 'T',24); Query OK, 1 row affected (0.00 sec) mysql>
然后查看Slave机器的reptest数据库:
Slave# mysql -u root -p Enter password: Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 12 to server version: 5.1.49 Type 'help;'or '\h' for help. Type '\c' to clear the buffer. mysql> use cdn; Database changed mysql>select * from reptable; +------+------+------+------+ | id | name| sex | age | +------+------+------+------+ | test1|4321 | T | 24 | +------+------+------+------+ 1 row in set(0.00 sec) mysql> source /root/etc/cdn.sql #导入压缩包中的cdn.sql
这样就ok了。接下来是一些性能方面的调优。
为MySQL添加TCMalloc库降低系统负载
TCMalloc(Thread-CachingMalloc)是google开发的开源工具──“google-perftools”中的成员。与标准的glibc库的malloc相比,TCMalloc在内存的分配上效率和速度要高得多,可以在很大程度上提高MySQL服务器在高并发情况下的性能,降低系统负载。
1、64位操作系统请先安装libunwind库,32位操作系统不要安装。libunwind库为基于64位CPU和操作系统的程序提供了基本的堆栈辗转开解功能,其中包括用于输出堆栈跟踪的API、用于以编程方式辗转开解堆栈的API以及支持C++异常处理机制的API。
wget http://download.savannah.gnu.org/releases/libunwind/libunwind-0.99.tar.gz tar zxvf libunwind-0.99.tar.gz cd libunwind-0.99/ CFLAGS=-fPIC ./configure make CFLAGS=-fPIC make CFLAGS=-fPIC install
2、安装google-perftools:
wget http://google-perftools.googlecode.com/files/google-perftools-1.6.tar.gz tar zxvf google-perftools-1.6.tar.gz cd google-perftools-1.6/ ./configure make && make install echo "/usr/local/lib" >/etc/ld.so.conf.d/usr_local_lib.conf /sbin/ldconfig
3、修改MySQL启动脚本(根据你的MySQL安装位置而定):
vi /usr/local/mysql/bin/mysqld_safe
在# executingmysqld_safe的下一行,加上:
export LD_PRELOAD=/usr/local/lib/libtcmalloc.so
保存后退出,然后重启MySQL服务。
4、使用lsof命令查看tcmalloc是否起效:
lsof -n | grep tcmalloc
如果出现以下信息,说明tcmalloc已经起效:
mysqld 10847 mysql mem REG 8,5 1203756 20484960/usr/local/lib/libtcmalloc.so.0.0.0
MySQL部分配置到此完毕,下面可以进入正题了:安装配置Bind-dlz。
四、安装配置Bind-DLZ 及相关脚本
1、安装bind
#mkdir /usr/local/src/bind-dlz #cd /usr/local/src/bind-dlz #wget http://ftp.isc.org/isc/bind9/9.6.0-P1/bind-9.6.0-P1.tar.gz #tar zxvf bind-9.6.0-P1.tar.gz #cd bind-9.6.0-P1 #./configure --with-dlz-mysql --enable-largefile --enable-threads=no--prefix=/usr/local/bind #make -j4 && make install
2、创建相关配置文件
cd /usr/local/bind/etc ../sbin/rndc-confgen >rndc.conf tail -n10 rndc.conf | head -n9 | sed -e s/#\//g >named.conf # vilocalhost.zone ttl 86400 @ IN SOA localhost. root.localhost. ( 1997022700 ; Serial 28800 ; Refresh 14400 ; Retry 3600000 ; Expire 86400 ) ; Minimum IN NS localhost. 1 IN PTR localhost. # dig >named.root
编辑named.conf:
#vi named.conf
最下面加入:
include"/usr/local/bind/etc/cnc_acl.conf"; //网通ACL include "/usr/local/bind/etc/telecom_acl.conf"; //电信ACL include "/usr/local/bind/etc/view.conf"; //DLZ相关的配
3、配置DNSTSIG
使用dnssec-keygenfunction 产生加密密钥,一个为public key,另一个为private key,本文假设应用服务器存在CNC,TELECOM,EDU,ANY
(1)产生加密金钥
#cd /usr/local/bind/sbin #./dnssec-keygen -a hmac-md5 -b 128 -n HOST cnc #./dnssec-keygen -a hmac-md5 -b 128 -n HOST telecom #./dnssec-keygen -a hmac-md5 -b 128 -n HOST edu #./dnssec-keygen -a hmac-md5 -b 128 -n HOST any
(2)查看生成的密钥文件
# cat Kcnc.+157+24406.private //以网通为例. Private-key-format: v1.2 Algorithm: 157 (HMAC_MD5) Key: YTjTOw00PzeEaasA16/Rvw== Bits: AAA=
将 YTjTOw00PzeEaasA16/Rvw== 加入到named.conf,其它同例。
详细请参照named.conf配置文件
配置named.conf
#vi /usr/local/bind/etc/named.conf key "rndc-key" { algorithm hmac-md5; secret "5PubnjGuAWeH9F2dIUYd6g=="; }; controls { inet 127.0.0.1 port 953 allow { 127.0.0.1; } keys {"rndc-key"; }; }; options { directory "/usr/local/bind/etc"; pid-file "named.pid"; }; #TSIG-key key "cnc" { algorithm hmac-md5; secret "YTjTOw00PzeEaasA16/Rvw=="; }; key "telecom" { algorithm hmac-md5; secret"pUcQGLpSH2tQgVZ9ZHU6Yg=="; }; key "edu"{ algorithm hmac-md5; secret"Bzo6MTzrzbRFQbONYTS1Cw=="; }; key "any"{ algorithm hmac-md5; secret"DHpPfGJdMLv91OygBf9H6w=="; }; #acl acl"dns-ip-list"{ 172.19.3.15; #masterDNS IP 172.19.1.3; #slaveDNS IP }; #acl include include"/usr/local/bind/etc/cnc_acl.conf"; //网通ACL include"/usr/local/bind/etc/telecom_acl.conf"; //电信 ACL include"/usr/local/bind/etc/edu_acl.conf"; //教育网ACL include"/usr/local/bind/etc/view.conf"; //bind-view部分
3、Bind启动脚本
#!/bin/bash # chkconfig: 345 71 71 # description:bind daemondcase"$1" in start) if [ -x/usr/local/bind/sbin/named ]; then /usr/local/bind/sbin/named -c /usr/local/bind/etc/named.conf -u bind echo "BIND9-named server started" fi ;; stop) kill `cat/usr/local/bind/etc/named.pid` && echo . && echo 'BIND9 serverstopped' ;; restart) echo . echo "Restart BIND9 server" $0 stop sleep 10 $0 start ;; reload) /usr/local/bind/sbin/rndcreload ;; status) /usr/local/bind/sbin/rndcstatus ;; *) echo"$0 start | stop | restart |reload |status" ;; esac chkconfig --add bind9 service bind9 start#启动bind service bind9 reload# 重载bind service bind9 restart# 重启bind
剩余文档见etc.tar.gz这个文件,里面很详细。部署master时候用tar zxf etc.tar.gz -C /usr/local/bind/etc覆盖即可,剩下的slave在部署bind还是将配置文件解压到/usr/local/bind/etc/即可,将rndc-key和dnssec重新配置一遍就可以用了!
Web管理界面可以在这里下载(下载之后解压缩,然后上传到你的NameServer下即可。这个管理界面最初是LinuxTone的Dennis写的,我在这里修改了一些bug):
注意事项
部署DNS,防火墙和路由器要设置清楚,我部署的时候就是因为硬防没有对master和slave服务器开放tcp和udp53端口,造成不能解析域名。需要大家切记!
作者简介:崔晓辉,网名coralzd,大众网系统管理员,精通网站系统架构、Unix技术。gtalk:coralzd@gmail.com
【编辑推荐】