Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

开发 前端 Hadoop
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

1.    权限相关配置参数

这里的权限由三部分组成,分别是:(1)管理员和普通用户如何区分 (2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序,(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。

管理员列表由参数yarn.admin.acl指定。

服务级别的权限是通过配置hadoop-policy.xml实现的,这个与Hadoop 1.0类似

队列级别的权限是由对应的资源调度器内部配置的,比如Fair Scheduler或者Capacity Scheduler等,具体阅读后面几节。

2.    日志聚集相关配置参数

日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负 载,且提供一个中央化存储和分析机制。默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配 置。

(1) yarn.log-aggregation-enable

参数解释:是否启用日志聚集功能。

默认值:false

(2) yarn.log-aggregation.retain-seconds

参数解释:在HDFS上聚集的日志最多保存多长时间。

默认值:-1

(3) yarn.log-aggregation.retain-check-interval-seconds

参数解释:多长时间检查一次日志,并将满足条件的删除,如果是0或者负数,则为上一个值的1/10。

默认值:-1

(4) yarn.nodemanager.remote-app-log-dir

参数解释:当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)。

默认值:/tmp/logs

(5) yarn.log-aggregation.retain-seconds

参数解释:远程日志目录子目录名称(启用日志聚集功能时有效)。

默认值:日志将被转移到目录

${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下

原文链接:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-log-aggregation/

责任编辑:陈四芳 来源: dongxicheng.org
相关推荐

2014-01-07 15:23:15

HadoopYARN

2014-01-07 16:34:36

HadoopYARN

2014-01-07 17:18:51

HadoopYARN

2014-01-07 15:05:25

HadoopYARN

2017-07-27 17:37:44

MySQL死锁日志

2010-09-07 11:14:56

DB2配置向导

2011-02-23 10:21:18

ProFTPd参数

2010-01-27 13:38:29

C++ Sum函数

2010-02-25 13:40:17

WCF禁用安全配置

2009-12-25 16:51:37

ADO参数

2010-01-04 14:54:08

ADO参数

2014-02-14 15:30:18

HadoopYARN

2010-09-25 13:31:00

TomcatJVM

2010-11-29 13:33:00

sybase配置参数

2017-07-28 15:40:01

数据库MySQL死锁与日志

2010-01-12 11:47:09

VB.NET可选参数

2010-05-31 16:54:29

SVN权限配置文件

2009-09-18 10:18:30

CLR Via

2010-03-29 16:31:48

2010-01-06 15:16:58

Ubuntu启动流程
点赞
收藏

51CTO技术栈公众号