解密HDFS如何判断磁盘存储大小,存储动态负载均衡的?

大数据 数据仓库
DataNode在运行过程中,为了计算DN的capacity使用量,实现数据存储的动态均衡,DN会对已配置的数据存储路径(dfs.datanode.data.dir)进行du -sk操作,以此获得capacity使用量汇报给NN中,然后NN就知道哪些DN有空间能被写数据进去,哪些是空间不足的。

1. HDFS对底层的磁盘存储如何选择的?

 一个HDFS集群,会有很多个datanode节点,每个datanode节点会挂载很多块磁盘。HDFS在存储数据时如何动态负载均衡最优化地往每个datanode,每个磁盘上存储数据呢?

 其实没啥,DataNode在运行过程中,为了计算DN的capacity使用量,实现数据存储的动态均衡,DN会对已配置的数据存储路径(dfs.datanode.data.dir)进行du -sk操作,以此获得capacity使用量汇报给NN中,然后NN就知道哪些DN有空间能被写数据进去,哪些是空间不足的。

图片

为了保证数据使用量的近实时性,目前DN是以默认10分钟的间隔时间执行一次。假设按照一个DN节点12个数据目录对应12块盘的情况,就会有12个du操作在每个10分钟内都会执行一次。在datanode存储的数据使用率比较高的时候,会十分消耗性能。直接引发阻塞io,系统load直线增高。

这种问题在大规模的集群中是很常见的,下面是针对线上(hadoop2.6版本的)简易零时的优化手段。说明:此问题仅存在于低于hadoop2.8版本,高于此版本已经修复。

https://issues.apache.org/jira/browse/HADOOP-9884

如果碰到这种情况,升级不了集群版本,那么我们还有其他奇技淫巧吗?

2.通过修改HDFS代码实现优化

先回顾一下du,df的使用

du原理简述:

du命令全程disk usage,它的统计原理在于将目标路径下的当前没有被删除的文件进行大小累加,然后得出总使用量。这种计算方式在文件数量少时往往不会表现出什么问题。但是当目标路径目录多,文件多的时候,du会表现出明显的时间执行耗时。

df 原理简述:

df命令统计值通过文件系统获取的。df命令的弊端是它不能按照具体目录进行使用量的统计。df是按照所在磁盘级别进行统计的。换句话说,用df命令在属于同一块物理盘的子路径下执行df命令,获取的值会是完全一致的。比较遗憾,这种情况将无法支持DataNode多block pool共用一块盘的情况。

处理方式:使用 df 命令替换 du

捕获到datanode执行过程中调用的 du -sk 命令,替换为df -k 。

实现脚本如下:

##将原始的 du指令更换名称

mv /usr/bin/du /usr/bin/du_bak
vim /usr/bin/du
#!/bin/sh
if [[ $2 == */current/BP-* ]] && [ $1 == -sk ]
then
    used=`df -k $2 | grep -vE 'Used' | awk '{print $3}'`
    echo -e "$used\t$2"
else
    echo -e "$(du_bak $@)"
fi

chmod +x /usr/bin/du

3.批量部署的执行环境

跳板机(10.90.72.195)已经部署好ansible环境,配置主机名,执行ansible-playbook脚本即可。

执行路径:/home/tool/updata_datanodes_du
需要修改的配置文件:/home/tool/updata_datanodes_du/datanodes
执行脚本:./run.sh

updata_du.yml

---
- hosts: all_datanodes
remote_user: root
gather_facts: F # 跳过gather_facts环节
serial: 70 #开启的并发数
tasks:
- name: "检查主机du是否已经被部署过"
stat:
path: "/usr/bin/du_bak"
register: file_stat
- name: "同步du脚本文件到目标主机"
copy: # 使用复制模块,进行文件分发,从本地主机分发到远程主机
src: '{{ item.src }}' # 源文件,变量定义多个源文件
dest: "/tmp/" # 文件复制到目标主机的目录
owner: root
group: root
mode: 0777
with_items: # 本地源文件列表
- { src: '/home/tool/updata_datanodes_du/scp_files/du' }
when: not file_stat.stat.exists
- name: "检查du文件是否同步成功"
stat:
path: "/tmp/du"
register: tmp_du_stat
- name: "备份du文件"
command: mv /usr/bin/du /usr/bin/du_bak
when: tmp_du_stat.stat.exists
- name: "更新为新的du脚本文件"
command: mv /tmp/du /usr/bin/du
when: tmp_du_stat.stat.exists

责任编辑:武晓燕 来源: 涤生大数据
相关推荐

2023-10-23 06:47:37

Redis磁盘存储

2017-04-17 13:24:43

数据库内存数据库存储

2018-10-31 09:07:56

磁带磁盘存储

2011-12-12 10:02:20

虚拟化本地存储SANsymphony

2013-01-21 13:38:27

IBMdW

2009-01-11 22:38:37

SSD固态盘绿色

2010-03-25 11:09:07

Hyper-V磁盘存储虚拟化Hyper-V

2017-11-08 08:31:57

NAS存储移动硬盘

2022-05-06 09:21:57

工作负载SPDK线程

2010-05-18 20:05:43

富士通磁盘存储

2018-08-28 15:10:16

数据库数据存储Hadoop

2023-03-30 13:32:51

负载均衡器HDFS

2019-05-16 14:28:48

硬盘存储设备

2018-12-03 13:50:03

流量网络负载均衡

2018-12-03 08:31:40

负载均衡解密Web 服务器

2017-08-14 09:05:50

SIOC存储负载

2023-11-22 08:35:34

存储引擎bitcask

2024-05-31 13:29:47

2015-04-02 12:42:26

HDFS分层存储高效

2017-05-22 14:58:01

负载存储性能
点赞
收藏

51CTO技术栈公众号