Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法简介

开发 架构 Hadoop
Hadoop经过长期的发展,已经更新了多个版本,这里向大家介绍一下Hadoop0.20.0部署与测试方面的内容,欢迎大家一起来学习,相信本文的介绍一定会让你收获不少。

本节向大家介绍一下Hadoop0.20.0部署与测试方面的内容,本节主要包括单机模式和伪分布模式操纵方法介绍等内容,希望通过本节的介绍大家能够掌握Hadoop0.20.0部署与测试方法。下面是具体介绍。

1.单机模式Local(Standalone)Mode

默认情况下,Hadoop被配置成以非分Java布式模式运行的一个独立进程。这对调试非常有帮助。
经过上述配置,就可以运行单机模式了。具体操作请查看手册

2.伪分布式模式的操作方法

Hadoop0.20.0部署中Hadoop可以在单节点上以所谓的伪分布式模式运行,此时每一个Hadoop守护进程都作为一个独立的Java进程运行。
0.20版本较之前版本比配置文件有较大改动,由原来全部配置在hadoop-site.xml改为分别配置在以下三个文件中:
conf/core-site.xml,conf/hdfs-site.xml,conf/mapred-site.xml

具体配置查看手册
以conf/core-site.xml为例:
 

  1. <configuration> 
  2. <property> 
  3. <name>fs.default.name</name> 
  4. <value>hdfs://localhost:9000</value> 
  5. </property> 
  6. </configuration> 

如果出现连接错误,可以尝试将了localhost替换为本机IP或127.0.0.1

Hadoop0.20.0部署中免密码ssh设置
现在确认能否不输入口令就用ssh登录localhost:
$sshlocalhost
如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
$ssh-keygen-tdsa-P''-f~/.ssh/id_dsa
$cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys

执行
格式化一个新的分布式文件系统:
$bin/hadoopnamenode-format

启动Hadoop守护进程:
$bin/start-all.sh

Hadoop守护进程的日志写入到${HADOOP_LOG_DIR}目录(默认是${HADOOP_HOME}/logs).
浏览NameNode和JobTracker的网络接口,它们的地址默认为:
*NameNode-http://localhost:50070/
*JobTracker-http://localhost:50030/
到这步为止,必须要先访问上面的NameNode网络接口,当页面能正常显示HDFS的状态时,才能正常进行下面的步骤。

1.点击Browsethefilesystem,***次进入可能会返回一个404错误页面。
2.返回上一页,刷新页面,这时候应该会出现下图所示画面,这就表明DFS已经正常工作(即DFSUsed等数值不再显示为0)。
3.如果不行就反复操作1,2步骤,直至成功。

将输入文件拷贝到分布式文件系统:$bin/hadoopfs-putconfinput
运行发行版提供的示例程序:$bin/hadoopjarhadoop-*-examples.jargrepinputoutput'dfs[a-z.]+'

查看输出文件:
将输出文件从分布式文件系统拷贝到本地文件系统查看:
$bin/hadoopfs-getoutputoutput
$catoutput/*
$bin/hadoopfs-getoutputoutput
$catoutput/*
或者
在分布式文件系统上查看输出文件:
 

  1. $bin/hadoopfs-catoutput/*  
  2. $bin/hadoopfs-catoutput/*  
  3. 3dfs.class  
  4. 2dfs.period  
  5. 1dfs.file  
  6. 1dfs.replication  
  7. 1dfs.servers  
  8. 1dfsadmin  
  9. 1dfsmetrics.log  
  10. 3 dfs.class  
  11. 2 dfs.period  
  12. 1 dfs.file  
  13. 1 dfs.replication  
  14. 1 dfs.servers  
  15. 1 dfsadmin  
  16. 1 dfsmetrics.log  

完成全部操作后,停止守护进程:$bin/stop-all.sh

Hadoop0.20.0部署与测试中的命令(Command)总结

这部分内容其实可以通过命令的Help以及介绍了解,我主要侧重于介绍一下我用的比较多的几个命令。Hadoopdfs这个命令后面加参数就是对于HDFS的操作,和Linux操作系统的命令很类似,例如:
Hadoopdfs–ls就是查看/usr/root目录下的内容,默认如果不填路径这就是当前用户路径;
Hadoopdfs–rmrxxx就是删除目录,如果多次执行,则每次执行前可以用此命令删除已存在的文件夹内容;
Hadoopdfsadmin–report这个命令可以全局的查看DataNode的情况;
Hadoopjob后面增加参数是对于当前运行的Job的操作,例如list,kill等;
Hadoopbalancer就是前面提到的均衡磁盘负载的命令。本节关于Hadoop0.20.0部署与测试相关内容介绍到这里。

【编辑推荐】

  1. 学习笔记 Hadoop0.20.0部署与测试
  2. Hadoop0.20.2集群配置入门指导手册
  3. Hadoop文件系统如何快速安装?
  4. Hadoop集群搭建过程中相关环境配置详解
  5. Hadoop完全分布模式安装实现详解
责任编辑:佚名 来源: csdn.net
相关推荐

2010-06-07 16:34:07

Hadoop0.20.

2010-06-04 15:44:06

Hadoop伪分布

2010-06-07 11:12:52

Hadoop-0.20

2010-06-07 15:21:00

hadoop-0.20

2010-06-04 18:29:02

Hadoop单机模式

2013-05-27 14:13:51

Hadoop 2.0.

2017-10-25 18:25:40

Hadoop伪分布式环境部署

2010-01-11 10:34:41

VB.NET图像操作

2011-07-20 15:08:22

C++

2010-02-24 08:11:59

Windows 7企业部署

2013-06-13 10:39:54

Hadoop2.0.4

2022-07-14 10:37:15

Jenkins持续集成

2014-07-17 14:09:31

Spark

2010-01-27 18:00:57

Android开机自启

2009-09-11 08:12:36

Windows 7企业部署网络部署

2014-09-04 09:35:17

2009-09-18 08:40:56

Windows 7企业部署VHD

2009-11-25 14:53:58

VS2003部署项目

2010-09-30 10:41:29

2014-05-16 10:55:47

Spark
点赞
收藏

51CTO技术栈公众号