本节书摘来华章计算机《Storm实时数据处理》一书中的第1章 ,第1.6节,(澳)Quinton Anderson 著 卢誉声 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.6 创建Storm集群——配置Storm
当拥有一组准备好进行应用程序配置的虚拟机后,你就可以在每个节点上安装和配置适当的软件包了。
1.6.1 实战
Step01 按照图1-7所示的目录结构,新建名为storm-puppet的项目。
Step02 在配置好的节点上,Puppet的运行入口(起点)是site.pp。在manifests目录下新建site.pp并添加以下内容:
Step03 接着,你需要定义Storm模块。模块应该放置于modules目录下,并且和Puppet项目根目录的结构一样,拥有自己的manifests和template目录结构。在Storm模块目录中创建必要的清单文件(modules/storm/manifests),首先创建init.pp:
Step04 每个storm节点上安装Storm应用程序的方法都是一样的,只是配置需要通过预先定义好的模板,根据实际情况进行调整。接着,我们来创建install.pp文件,该文件会指定需要下载和安装的二进制文件:
这里的install清单文件是建立在Ubuntu的Debian安装包基础之上的。它基于脚本构建,并可以根据需求进行调整。二进制文件和创建脚本可以在https://bitbucket.org/qanderson/storm-deb-packaging找到。
将会安装以下包:
- Storm
- ZeroMQ:http://www.zeromq.org/
- Java-ZeroMQ
Step05 每个节点的配置是通过基于模板产生的配置文件生成的。在storm清单目录下创建config.pp:
Step06 所有storm参数都通过Hiera定义。Hiera则会使用storm清单目录下params.pp定义的Hiera配置:
由于属性的数量过多,因此在此省略了配置的其他内容。请到位于https://bitbucket.org/ganderson/storm-puppet/src的Git代码仓库获取完整的清单文件。
Step07 然后指定每个节点类。我们先定义nimbus类:
然后是supervisor类:
接着是ui类:
最后指定zoo类(供zookeeper节点使用):
Step08 创建好所有文件后,初始化Git代码仓库并提交至bitbucket.org。
Step09 为了确保配置生效,我们还要回到vagrant-storm-cluster目录并执行以下命令:
Step10 如果你想通过ssh访问任意一个节点,只需执行下面的命令:
将nimbus替换为你所需的节点名。
1.6.2 解析
在使用Puppet过程中,可以应用多种不同的模式。最简单的方法是使用分布式模型,在这种模式下,每一个节点进行自主配置,这与使用Puppet Master的集中式模式完全不同。 在分布式模型中,若要更新服务器配置,只需更新配置清单,并将配置清单提交到集中式Git代码仓库即可。所有节点随后会获取并应用这些配置。可以通过cron jobs、触发器,或者使用如Jenkins、Bamboo、Go这样的持续集成工具完成这项工作。使用以下命令调用Vagrant,在开发环境中进行配置:
这时Puppet就会应用清单文件。Puppet是一个使用声明式语言的配置管理工具,其中每一个语言元素都定义了期望的状态以及获得该状态的方法。也就是说,当系统已经处于所需状态下时,Puppet就会跳过特定的配置步骤,也就避免了重复配置的不利影响。
每个节点都会克隆storm-puppet项目,并在其本地应用清单配置。每个节点只应用与自己对应的配置项,而应用哪一项配置取决于site.pp清单中定义的主机名,比如:
在这种情况下,nimbus节点将包含cluster1的Hiera配置,然后将会安装nimbus和ui节点。由于在node定义中可以包含任意类的组合,因此你能够方便地定义整个环境。