部署分布式文件系统需要注意什么?

运维 系统运维 分布式
分布式文件系统在微软的服务器构建上具有很大的实用价值,不过这个分布式文件系统也是一个比较娇贵的东西,要把它伺候好,让他为企业服务,还不是一件容易的事情。在部署分布式文件系统时,需要注意哪些问题?

  分布式文件系统是微软服务器中很重要的一项功能。通过分布式文件系统网络管理员可以将服务器文件分散存储到网络上的多台服务器上,以提高服务器性能并增强服务器的容错性。最重要的是,这对于普通用户来说是透明的,用户只需要从一个地点访问这些文件即可。分布式文件系统的具体部署如下:

  如现在有一家企业提供WEB服务。为了提高WEB服务器的性能与容错性,他们就采用了分布式文件系统。把WEB服务器的内容存放在2台服务器中。即WEB文件被重复的存储在多台计算机中。用户通过DFS(用户认为的WEB服务器)读取文件时,DFS就会自动给用户从其中一台服务器内读取文件。对于用户来说,并不需要知道这些文件的真正存储地点(即对用户来说他们不知道WEB服务器A与服务器B的存在)。如此部署的话,主要是为了提到服务器负载均衡与提高WEB服务器的容错性能两个目的。假设现在有多个用户需要浏览网页,DFS会根据实际情况避免从同一台服务器读取网页内容。它会分散地从不同的服务器给不同的用户读取网页。通过这种方式可以把分担分散到不同的服务器上。同样,如果当用户访问网页时,即使有一台WEB服务器发生了故障不能够正常访问时,DFS仍然可以从另外一台运行正常的服务器中读取用户所需要访问的网页。从而提高了WEB服务的容错性能。

  可见分布式文件系统在微软的服务器构建上具有很大的实用价值。不仅仅是WEB服务器,还有文件服务器、FTP服务器等等,都可以通过这种方式来提高服务器的容错能力,均衡服务器的负担等等。不过这个分布式文件系统也是一个比较娇贵的东西,要把它伺候好,让他为企业服务,还不是一件容易的事情。具体来说,在部署分布式文件系统时,需要注意以下问题。

  1、需要注意DFS(分布式文件系统)根目录的放置。当用户访问WEB网页时,他们只知道要访问某个网站,而不知道网站后面可能还有其他服务器的存在。用户要访问的WEB服务器其实就是DFS根目录所在的主机。网络管理员要实现分布式文件系统,必须要先将网络中一台服务器内的共享文件夹设置为DFS根目录。这个DFS根目录主要用来存储分布式文件系统的映射关系。网络管理员要为该根目录取一个简约的名字,其他用户就可以通过这个名字访问这个分布式文件系统根目录下的文件。可见DFS根目录的安全性直接跟WEB服务器的安全相关。而且其也跟WEB应用服务的稳定性息息相关。因为如果这个目录出现了问题,映射关系遭受到破坏,则用户将无法正常访问文件资源。为了提高这个根目录的安全性,笔者建议是要把这个根目录部署在微软的NTFS文件系统上,并对此配置一定的安全措施。由于NTFS文件系统要比FAT32文件系统安全的多。无论是加密技术或者数据还原上,NTFS文件系统都有比较突出的表现。故笔者觉得,使用NTFS文件系统当作分布式文件系统的根目录,则其安全性与稳定性会更有保障一点。

  2、部署多台主机服务器。如果DFS在微软的域环境中,则必须是域的成员才能够存储DFS根目录。换句话说,要成为DFS服务器,则必须加入到微软的域中。这台存储DFS根目录的服务器被称为主机服务器。域DFS可以通过创建另一个新的DFS根目录目标的方式,将DFS根目录复制到其他的服务器内。如上图中,DFS根目录的目标有两个,分别映射到两台服务器的共享文件夹。即DFS根目录中的内容被同时存储到这两台服务器种,以实现服务器负载均衡以及提供比较高的容错性能。从理论上来说,主机服务器越多,其容错性能越好,用户访问服务器的性能也越好。这些主机服务器的设置数据可以通过活动目录自动同步。为此当一台存储DFS根目录的主机服务器发生故障时,用户还是可以从其他的主机服务器读取到根目录内的设置数据。所以可以说主机服务器它具备了DFS映射关系的容错功能。简单的说,主机服务器之间的数据会自动发生同步,从而保证各台服务器之间数据的一致性。但是这就会发生一个问题。如果服务器比较多的时候,那么这个数据同步就可能会占用比较多的网络带宽。而且架立服务器也需要不少的投入。为此笔者觉得,主机服务器也并不是越多越好。网络管理员需要根据预计访问的用户、对于容错性的要求等等角度,去考虑主机服务器的数量。对于普通企业来说,这主机服务器2台到3台也就够了。多了也是种浪费。

  3、要选择合适的分布式文件系统类型。Windows服务器(以2003服务器操作系统为例)其主要支持两种分布式文件系统类型。这两种类型分别为域DFS与独立的DFS。这两种分布式文件系统各有各的特点。网络管理员需要了解这两种分布式文件系统的特点,并根据企业自身的需求选择合适的实现方式。这里笔者要强调的是,无论是哪种分布式文件系统类型,他们都支持容错功能。无论是域DFS还是独立的DFS,一个DFS链接的目标可以同时映射到多台服务器的共享文件夹,这些共享文件夹中存储着相同的文件。当有一台服务器发生故障时,用户还是可以从其他的计算机获取文件。也就是说,无论哪种实现方式都可以提供DF链接容错功能。这也是这两种分布式文件系统类型的唯一共同之处。另外需要注意的是主机服务器之间文件的复制问题。在域DFS中,主机服务器之间的DS根目录复制,还有DFS链接的多个目标之间文件的复制,都可以通过文件复制服务来实现自动复制。但是如果是独立的DFS,则DFS链接的多个目标之间文件的复制,需要网络管理员手工操作。这个差异让独立DFS只限于在小规模范围内使用。除了这个差异外,独立DFS还不具有DFS映射关系的同步功能与DFS根目录的容错功能。故当采用独立的DFS系统类型时,网络管理员需要花费比较多的时间去实现这个数据同步功能。故笔者建议对于独立的分布式文件系统要慎用。另外是否采用独立DFS,还有出于兼容性的考虑。这方面的内容笔者会在下一点进行说明。

  4、要注意早期操作系统对分布式文件系统的支持。一般来说只有安装了DFS客户端软件的客户端计算机,才可以访问DFS内的文件。另外也只有某些特定的计算机操作系统才具备存储DFS根目录的功能。通常情况下,Windows2000(包含2000操作系统)以及以后的系统默认情况下都已经安装了DFS客户端,故这些操作系统对DFS文件系统的支持是没有文件的。需要注意的是早期的操作系统对其的支持。如Windows95操作系统,虽然其可以支持DFS分布式文件系统,但是另外下载并安装DS客户端软件。而Windows98操作系统默认情况下已经安装了DFS客户端,可是这个客户端只能够支持独立的DFS分布式文件系统类型。如果要访问域DFS分布式文件类型,则必须对这个DFS客户端软件进行升级。所以如果企业网络中存在着比较老的计算机操作系统,那么是网络管理员部署分布式文件系统的一大障碍。

  另外最后笔者需要强调的一点就是安全问题。从上面的描述中大家可以看出,分布式文件系统是在各个服务器的共享文件夹上实现的。为了分布式文件系统的安全性,最好能够把共享文件夹设置在NTFS文件系统下,并利用NTFS文件系统的权限与共享权限来提高这些共享文件的安全。不能因为采用了DFS文件系统而给数据安全带来了负面影响。否则的话,DFS的容错性与服务器性能负载均衡也无从谈起。

责任编辑:黄丹 来源: 中国IT实验室
相关推荐

2010-11-01 05:50:46

分布式文件系统

2017-10-17 08:33:31

存储系统分布式

2013-06-18 14:00:59

HDFS分布式文件系统

2012-08-31 16:04:11

HDFS分布式文件系统

2013-01-07 10:29:31

大数据

2010-11-15 13:24:07

分布式文件系统

2010-06-04 18:45:43

Hadoop分布式文件

2012-09-19 15:05:24

MogileFS分布式文件系统

2012-09-19 13:43:13

OpenAFS分布式文件系统

2013-05-27 14:46:06

文件系统分布式文件系统

2011-07-15 17:48:27

Platform

2012-05-10 15:23:53

分布式文件系统测试

2012-10-09 16:43:47

FastDFS分布式文件系统

2020-01-03 08:33:57

Ceph硬件系统

2011-03-16 14:23:38

分布式文件

2012-05-10 14:04:07

分布式文件系统架构

2023-05-05 08:16:56

SeaweedFS分布式文件

2022-09-13 07:51:08

JuiceFS分布式文件系统

2012-07-20 14:40:22

2012-11-15 15:18:08

MooseFS
点赞
收藏

51CTO技术栈公众号