Chef在大数据集群部署中的应用-大数据集群部署方案

Chef的基本架构

Chef是一个C/S架构的分布式软件配置管理工具。

Chef架构（源自https://wiki.opscode.com/display/chef10/Architecture+Introduction）

Chef Server存储配置各个节点所需的所有信息，以REST API接口提供服务，Chef Nodes是指那些安装了chef-client的节点，chef-client主要用于与Chef Server通信，获取各自的runlist和recipes，进行相应的软件安装、配置和启动工作。

Chef通过Cookbook的方式进行软件配置，每一个Chef Cookbook定义了如何去配置某一个特定service或app，整个配置过程可能被定义为多个step，每一个step称为一个recipe，Cookbook需要上传到Chef Server由其进行统一管理。

Chef还需要为Cookbook定义相应的role，一个role有一个定义recipe执行顺序的runlist。每一个Chef Client可能需要安装若干个role，运行时由chef-client进程与ChefServer通信，获得每一个role对应的runlist，并根据runlist下载相应的Cookbooks，依次执行各个recipe以实现某个service/app的安装配置。

在recipe中有一个关键部分叫做resource，每一种resource定义一种特定的软件配置，譬如rpm的安装，用户/组的创建管理，目录的创建管理，service的启动/停止等等，每一个resource对应一个provider。开发recipe时可以按需求使用相应的resource，chef-client会由相应的provider来完成每一个resource的工作。关于Chef的resource可进一步参考https://docs.opscode.com/resource.html。

关于Chef的基本概念和教程可进一步参考https://learnchef.opscode.com。

Chef的各个组件及其工作机制

Chef的架构中主要包括Chef Server, CouchDB, RabbitMQ, ChefExpander/Indexer, Solr, Chef Client, Knife等。

Chef组件（源自https://wiki.opscode.com/display/chef10/Architecture）

Chef Server使用CouchDB存储其所有信息，使用Solr提供Search功能，当有数据更新时，Chef Server会更新CouchDB中对应的document，并将数据通过RabbitMQ传递给chef-expander，由其调度更新到Solr中。

当Chef Server接收到一个搜索请求时，Chef Server先调用Solr的Rest API得到搜索结果，即所有符合请求条件的document的ID，在根据该ID到CouchDB中获取每一个document全文返回给客户端。

Knife是Chef提供的一个命令行工具，用于与Chef Server进行通信，Chef的所有功能都可以通过knife来操作。

vSphere Big Data Extensions是如何使用Chef的

在vSphere Big Data Extensions（BDE）或Serengeti中，Chef Server和WorkStation被安装在Management Server中，chef-client被预装在Serengeti部署出的虚拟机中。

Serengeti安装好以后，在Management Server中已经配置好了Chef Server，并为其配置好了Serengeti所开发的各种roles和相应的cookbook，用户在创建cluster的时候需要为每个nodegroup指定相应的roles，当虚拟机创建完成以后，Serengeti Web Service收集虚拟机的硬件信息和用户定义好的cluster配置，通过thriftservice发送给Ironfan，Ironfan负责与Chef Server交互，在ChefServer上创建各个Node和Role信息，***启动每个node上的chef-client，通过ChefServer获取各自的roles和runlist，并下载相应的Cookbook进行软件的安装配置。

关于Serengeti，ChefServer，以及各个Node之间的拓扑关系，可以参考我们的另外一篇博客《深入解析大数据虚拟化的架构（下）- 系统架构》

实例讲解Chef和Serengeti的工作机制

在本部分中我们通过实例讲解BDE/Serengeti是如何通过Chef来安装软件的，为了降低复杂度，我们选用Zookeeper作为例子，因为Zookeeper的配置比较简单且对其他Cookbook的依赖性较小。本篇我们并不会详细讲解如何开发Cookbook，相关的教程网上可以找到很多。

（1）准备Cookbook并定义相应的role

Serengeti的所有Cookbooks和Roles位于目录/opt/serengeti/cookbooks中。

先看一下Zookeeper的cookbook代码结构：

$ treecookbooks/zookeeper/

cookbooks/zookeeper/

├──attributes

│ └── default.rb

├──metadata.rb

├──README.rdoc

├──recipes

│ ├── default.rb

│ ├── install_from_package.rb

│ └── install_from_tarball.rb

└──templates

└── default

├── java.env.erb

├── log4j.properties.erb

├── myid.erb

├── zkEnv.sh.erb

├── zoo.cfg.erb

└── zookeeper-server.erb

对于zookeeper这个role的定义：

$ catroles/zookeeper.rb

name 'zookeeper'

description'A role for running Apache zookeeper server'

run_list*%w[

zookeeper

]

该run_list只有一项，意思是说如果某一个node中含有zookeeper这个role，那么这个node在安装zookeeper的时候需要运行cookbooks/zookeeper/recipes/default.rb这个recipe。

default.rb这个recipe主要做以下工作：

a) 安装Java，mount disks, 这一步是通过调用其他recipe来实现的；

b) 创建必要的目录，用户，用户组等；

该步骤中我们使用如下code片段来创建用户：

user "zookeeper" do

group "zookeeper"

shell "/bin/bash"

password nil

supports :manage_home => false

action [:create, :manage]

end

该code使用了Chef的user这个resource来create一个名为”zookeeper”的用户名，参考http://docs.opscode.com/chef/resources.html#user，该用户名属于”zookeeper”组，使用/bin/bash作为其login shell，不指定home目录。

c) 安装软件包，根据distro的不同可能通过tarball或者RPM的方式来安装；

d) 将templates目录的配置文件拷贝到指定位置并做进一步的配置，启动Zookeeper Service;

e) 更新状态信息，以通知其他依赖于Zookeeper Service的Node。

(2) 上传Cookbook和Role,配置manifest文件.

$ knifecookbook upload -a /opt/serengeti/cookbooks/cookbooks

$ kniferole from file /opt/serengeti/cookbooks/roles/*

查看manifest文件

$ cat/opt/serengeti/www/distros/manifest

[

{

"name" : "apache",

"vendor" : "Apache",

"version" : "1.2.1",

"hveSupported" : "true",

"packages" : [

...

{

"roles" :["zookeeper"],

"tarball" :"apache/1.2.1/zookeeper-3.4.5.tar.gz"

}

]

...

]

该manifest文件中定义了apache1.2.1的distro中支持zookeeper这个role，且指定了从哪里可以得到zookeeper的tarball。

（3）创建包含zookeeper的cluster

创建包含有zookeeper role的specFile，可以参考/opt/serengeti/samples/default_hbase_cluster.json

{

"nodeGroups" : [

{

"name" : "zookeeper",

"roles" : [

"zookeeper"

...

]

"configuration" : {

}

使用Serengeti的CLI创建cluster:

serengeti>clustercreate --name test01 --specFile/opt/serengeti/samples/default_hbase_cluster.json --distro apache

Web Service创建完所有虚拟机以后会通过Thrift Service调用Ironfan的API，并将必要的虚拟机信息传给Ironfan，这些信息包括每个node的rolelist，ip地址，位于哪个physical host上，配置了哪几个disk，tarball的完整下载地址以及用户自定义的配置信息等等，Ironfan基于这些信息在Chef Server上创建各个node的信息，***启动每个node上的chef-client。

我们可以login到node上查看一些chef-client的信息：

$ cat/etc/chef/client.rb

log_level :info

log_location STDOUT

chef_server_url "http://<chef_server_ip>:4000"

validation_client_name"chef-validator"

node_name"test01-zookeeper-0"

手动启动chef-client，从log信息中了解chef-client的运行状况

$ sudo chef-client -c/etc/chef/client.rb

关于vSphere Big Data Extensions:

VMware vSphere Big Data Extensions（简称BDE）基于vSphere平台支持大数据和Apache Hadoop作业。BDE以开源Serengeti项目为基础，为企业级用户提供一系列整合的管理工具，通过在vSphere上虚拟化Apache Hadoop，帮助用户在基础设施上实现灵活、弹性、安全和快捷的大数据部署、运行和管理工作。了解更多关于VMware vSphere Big Data Extensions的信息，请参见http://www.vmware.com/hadoop。

作者介绍

[[89948]]

卞小丁

VMware 研发工程师，清华大学自动化系本硕，数据挖掘方向，2012年毕业加入VMware。致力于Serengeti产品的设计开发工作，对分布式系统，大数据挖掘等有较深入理解。