本节向大家介绍一下Hadoop分布式文件系统既是HDFS的安全隐患问题,主要包括Hadoop概念和配置介绍,HDFS环境和安全隐患等内容,欢迎大家一起来学习,希望通过本节的介绍大家对HDFS安全隐患有一定的认识,以便在以后学习和使用Hadoop过程中减少不必要的麻烦。
Hadoop分布式文件系统(HDFS)的安全隐患
一.基础问题
hadoop是什么?如何配置等基础概念以下不做讨论.
一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。
Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streamingaccess)文件系统中的数据。
二.Hadoop分布式文件系统环境
软件环境:hadoop-0.19.1
HDFS系统:公网linux2.4若干台
Namenode:nn1台
Datenode:dn若干台
客户端:OSX10.6
三.如何对Hadoop文件进行攻击要点(安全隐患)
1)
获得HadoopNameNodeURI,例如nn:9001
配置到客户端hadoop-site.xml中即可.
2)
客户端通过FSshell进行文件操作,
次步骤可简单理解为客户端通过本地Hadoop中配置hadoop-site.xmlnamenodeuri进行远程访问,获取HDFS文件列表,
3)
*如遇到验证失败,在本地创建用户名xxx用户,xxx本地用户名和提示验证用户名称一直即可.
*解释:HDFS启动时会以启动用户(root或hadoop)为HDFSRoot用户,所以客户端进行访问时本地新建此用户名和HDFSRoot用户名称一致即可,HDFS并不进行验证密码.
*此时,就获得的HDFS系统的HDFSRoot权限,可以为所欲为了.:)
4)
HadoopAPI与FSShell以上述同理
四.思考
虽然nn可以设置的比较隐秘,但是依然可以被扫描到,所以只靠隐秘nn方法对HDFS系统的安全保障是并不可取的.
虽然可以用网络划分或防火墙进行隔离,但是对于Hadoop框架设计而言,是有重大安全遗漏的.
我认为依然有许多HDFS系统目前正在公网运行中本节关于Hadoop分布式文件系统的安全隐患介绍到这里。
【编辑推荐】