本节和大家一起继续学习有关Hadoop0.20.2集群配置方面的内容,上节我们介绍到Hadoop的配置,接下来该启动Hadoop了。欢迎大家一起来学习Hadoop0.20.2集群配置的方法,相信通过本节的介绍大家对如何进行Hadoop0.20.2集群配置有一定的认识。
一、hadoop启动
先格式化一个新的分布式文件系统
$cdhadoop-0.20.2
$bin/hadoopnamenode-format
查看输出保证分布式文件系统格式化成功。
Hadoop0.20.2集群配置过程中在主节点master上面启动hadoop,主节点会启动所有从节点的hadoop。
$bin/start-all.sh
从主节点master关闭hadoop,主节点会关闭所有从节点的hadoop。
$bin/stop-all.sh
Hadoop守护进程的日志写入到${HADOOP_LOG_DIR}目录(默认是${HADOOP_HOME}/logs).
浏览NameNode和JobTracker的网络接口,它们的地址默认为:
NameNode-http://master:50070/
JobTracker-http://master:50030/
将输入文件拷贝到分布式文件系统:$bin/hadoopfs-putconfinput
运行发行版提供的示例程序:$bin/hadoopjarhadoop-0.20.2-examples.jargrepinputoutput'dfs[a-z.]+'
查看输出文件:
将输出文件从分布式文件系统拷贝到本地文件系统查看:
$bin/hadoopfs-getoutputoutput
$catoutput/*
或者
在分布式文件系统上查看输出文件:$bin/hadoopfs-catoutput/*
启动运行成功后,可以多熟悉熟悉hadoopdfs命令,例如:
hadoopdfs–ls查看/usr/root目录下的内容,默认如果不填路径这就是当前用户路径;
hadoopdfs–rmrxxxxxx就是删除目录;
hadoopdfsadmin-report这个命令可以全局的查看DataNode的情况;
hadoopjob-list后面增加参数是对于当前运行的Job的操作,例如list,kill等;
hadoopbalancer均衡磁盘负载的命令。本节关于Hadoop0.20.2集群配置方面的内容就介绍到这里。
【编辑推荐】
- Hadoop0.20.2集群配置入门指导手册
- Hadoop集群配置全程跟踪报道
- 专家讲解 Hadoop:HBASE松散数据存储设计
- 两种模式运行Hadoop分布式并行程序
- 轻松实现Hadoop Hdfs配置