Linux高可用性方案之Heartbeat的日常维护命令(原创)

简介:

crm_resource 
crm_resource命令对资源执行各种资源相关的操作。它可以修改已配置资源的定义、启动和停止资源,以及在节点间删除和迁移资源。
crm_resource  [-?|-V|-S] -L|-Q|-W|-D|-C|-P|-p [options]
示例
列出所有资源:
crm_resource -L 
检查正在运行资源的位置(以及是否在运行):
crm_resource -W  -r my_first_ip 
如果 my_first_ip 资源正在运行,此命令的输出中会显示正在运行资源的节点。如果资源没有在运行,输出中会显示此情况。
启动或停止资源:
crm_resource  -r  my_first_ip -p   target_role -v   started 
crm_resource  -r  my_first_ip -p   target_role -v   stopped 
查询资源的定义:
crm_resource  -Q  -r my_first_ip 
将资源迁离当前位置:
crm_resource  -M  -r  my_first_ip 
将资源迁移到指定的位置:
crm_resource  -M  -r  my_first_ip -H   c001n02 
允许资源返回其常规位置:
crm_resource -U  -r  my_first_ip 
注: resource_stickiness 和 default_resource_stickiness 的值可能会意味着资源没有移回。在这种情况下,应先使用 -M 将资源移回,再运行此命令。
从 CRM 删除资源:
crm_resource   -D  -r   my_first_ip -t primitive 
从 CRM 删除资源组:
crm_resource -D  -r  my_first_group -t group 
为 CRM 中的资源禁用资源管理:
crm_resource -p is-managed -r my_first_ip -t primitive -v off 
为 CRM 中的资源启用资源管理:
crm_resource  -p  is-managed -r my_first_ip -t primitive -v on 
在手动清理后,重设置有故障的资源:
crm_resource -C  -H   c001n02 -r   my_first_ip 
重新检查所有节点,以找出从 CRM 之外启动的资源:
crm_resource  -P 
重新检查一个节点,以找出从 CRM 之外启动的资源:
crm_resource  -P  -H c001n02 
crm_resource的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmresource.html
crm_mon 
crm_mon:crm_mon 命令允许您监视群集的状态和配置。其输出包括节点数、uname、uuid、状态、群集中配置的资源及其各自的当前状态。crm_mon 的输出可以显示在控制台上或打印到 HTML 文件。当具有不包含状态部分的群集配置文件时,crm_mon 会按文件中所指定的方式创建节点和资源概览。 
示例
显示群集的状态并每隔 15 秒获取一次更新后的列表:
crm_mon 
显示群集的状态并在 -i 中指定的间隔后获取一次更新后的列表。如果 -i 未指定,则采用 15 秒的默认刷新间隔:
crm_mon -i interval[s] 
在控制台上显示群集状态:
crm_mon -c 
在控制台上显示一次群集状态,然后退出:
crm_mon -1 
显示群集的状态并按节点对资源分组:
crm_mon -n 
显示群集的状态,按节点对资源分组,并在列表中包括不活动的资源:
crm_mon -n -r 
将群集的状态写入 HTML 文件:
crm_mon -h filename 
在后台作为守护程序运行 crm_mon,指定守护程序的 pid 文件以更轻松地控制守护程序进程,并创建 HTML 输出。此选项允许您持续创建 HTML 输出,该输出可以由其他监视应用程序轻松处理:
crm_mon -d -p filename -h filename 
在现有群集配置文件(文件名)中显示群集配置,按节点对资源分组,并包括不活动的资源:此命令用于群集在线前的群集配置测试。
crm_mon -r -n -X filename 
crm_mon的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmmon.html
crm_failcount 
crm_failcount:Heartbeat 实施了一种精密的计算方法,当资源在当前节点上趋向失败时强制将该资源故障转移到其他节点。资源携带了一个 resource-stickiness 属性以确定它希望在某个节点上运行的自愿程度。它还具有 migration-threshold 属性,可用于确定资源应故障转移到其他节点的阈值。
可将 failcount 属性添加到资源,它的值将根据资源监视到的故障而递增。将 failcount 的值与 migration-threshold 的值相乘,可确定该资源的故障转移分数。如果此数字超过该资源的自选设置,则该资源将被移到其他节点并且不会在原始节点上再次运行,直到重设置故障计数。
crm_failcount 命令可查询指定节点上每个资源的故障计数。此工具还可用于重设置故障计数,并允许资源在它多次失败的节点上再次运行。  

示例
重设置节点 node1 上资源 myrsc 的故障计数:
crm_failcount -D -U node1 -r my_rsc 
查询节点 node1 上资源 myrsc 的当前故障计数:
crm_failcount -G -U node1 -r my_rsc
查看资源的积分 
# 2>&1 /usr/heartbeat/sbin/ptest -LVVVVVVVV|grep -E "dump_node_scores" 
crm_failcount的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmfailcount.html

cibadmin 
cibadmin:cibadmin 是用于操作 Heartbeat CIB 的低级管理命令。它可以用来转储、更新或修改所有或部分 CIB,删除整个 CIB 或执行各种 CIB 管理操作。
cibadmin 在 CIB 的 XML 树上运行,基本上不清楚所执行的更新或查询的含义。这意味着对于理解 XML 树中的元素含义的人来说很常见的快捷方式无法用于 cibadmin。它在输入和输出时要求消除不明确性,并且只能处理有效的 XML 子树(标记和元素)。
注: 使用 cibadmin 应始终优先于手动编辑 cib.xml 文件,特别是在群集活动的情况下。群集会竭尽全力检测和阻止此做法,从而确保您的数据不会丢失或损坏。 

示例
要获取递送到 stdout 的整个活动 CIB(包含状态部分等)的副本,请发出以下命令:
cibadmin -Q 
要向资源部分添加 IPaddr2 资源,首先要使用以下内容创建一个文件 foo:
   <primitive id="R_10.10.10.101" class="ocf" type="IPaddr2"
    provider="heartbeat">
    <instance_attributes id="RA_R_10.10.10.101">
     <attributes>
      <nvpair id="R_ip_P_ip" name="ip" value="10.10.10.101"/>
      <nvpair id="R_ip_P_nic" name="nic" value="eth0"/>
     </attributes>
    </instance_attributes>
   </primitive>
 
然后发出以下命令:
cibadmin --obj_type resources -U -x foo 
要更改先前添加的 IPaddr2 资源的 IP 地址,请发出以下命令:
cibadmin -M -X '<nvpair id="R_ip_P_ip" name="ip" value="10.10.10.102"/>' 
注: 此命令不会更改资源名称以匹配新的 IP 地址。要执行该操作,请先删除资源再重新添加带有新ID标记的资源。 
要停止(禁用)先前添加的 IP 地址资源而不将它删除,请创建包含以下内容的名为 bar 的文件:
<primitive id="R_10.10.10.101">
 <instance_attributes id="RA_R_10.10.10.101">
  <attributes>
   <nvpair id="stop_R_10.10.10.101" name="target-role" value="Stopped"/>
  </attributes>
 </instance_attributes>
</primitive>
 
然后发出以下命令:
cibadmin --obj_type resources -U -x bar 
要重启动上一步中停止的 IP 地址资源,请发出以下命令:
cibadmin -D -X '<nvpair id="stop_R_10.10.10.101">' 
要将此 IP 地址资源从 CIB 中彻底删除,请发出以下命令:
cibadmin -D -X '<primitive id="R_10.10.10.101"/>' 
要将 CIB 替换为新的手动编辑版本,请使用以下命令:
cibadmin -R -x $HOME/cib.xml

cibadmin的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_cibadmin.html

crm_verify 
crm_verify:crm_verify 用于检查配置数据库 (CIB) 的一致性和其他问题。它可用来检查包含配置的文件,并可连接到正在运行的群集。它报告两类问题:错误和警告。必须修复错误,Heartbeat 才能正常工作。但是,应让管理员来决定警告是否也应修复。
crm_verify 可帮助创建新的或已修改的配置。您可以在运行的群集中获取 CIB 的本地副本,编辑它,使用 crm_verify 验证它,然后使用 cibadmin 使新配置生效。 
示例
检查运行的群集中配置的一致性,并生成详细输出:
crm_verify -VL 
检查指定文件中的配置的一致性,并生成详细输出:
crm_verify -Vx file1 
将配置传送到 crm_verify,并生成详细输出:
cat file1.xml | crm_verify -Vp 
crm_verify的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmverify.html
crm_diff

crm_diff:命令协助创建和应用 XML 增补程序。这对可视化两个版本的群集配置之间的更改或保存更改可能非常有用,以便以后使用 cibadmin 应用更改。

示例
使用 crm_diff 确定各种 CIB 配置文件的区别并创建增补程序。通过增补程序的方式,轻松重用各个配置部分,而不必对每个部分使用 cibadmin 命令。
通过对要比较的两个群集设置运行 cibadmin 命令,获取两个不同的配置文件:
cibadmin -Q > cib1.xml
cibadmin -Q > cib2.xml
 
确定是区分所有文件还是只比较配置子集。
要将文件间的区别打印到 stdout,请使用以下命令:
crm_diff -o cib1.xml -n cib2.xml 
要将文件间的区别打印到某个文件并创建增补程序,请使用以下命令:
crm_diff -o cib1.xml -n cib2.xml > patch.xml 
将增补程序应用于原始文件:
crm_diff -o cib1.xml -p patch.xml 
crm_diff的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmdiff.html


参考至:http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmresource.html

          http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmfailcount.html

          http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_cibadmin.html

          http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmverify.html

          http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmdiff.html

          http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmmon.html

本文原创,转载请注明出处、作者

如有错误,欢迎指正

邮箱:czmcj@163.com

作者:czmmiao 原文地址:http://czmmiao.iteye.com/blog/1181720
相关文章
|
2月前
|
Linux 应用服务中间件 Shell
二、Linux文本处理与文件操作核心命令
熟悉了Linux的基本“行走”后,就该拿起真正的“工具”干活了。用grep这个“放大镜”在文件里搜索内容,用find这个“探测器”在系统中寻找文件,再用tar把东西打包带走。最关键的是要学会使用管道符|,它像一条流水线,能把这些命令串联起来,让简单工具组合出强大的功能,比如 ps -ef | grep 'nginx' 就能快速找出nginx进程。
374 1
二、Linux文本处理与文件操作核心命令
|
2月前
|
Linux
linux命令—stat
`stat` 是 Linux 系统中用于查看文件或文件系统详细状态信息的命令。相比 `ls -l`,它提供更全面的信息,包括文件大小、权限、所有者、时间戳(最后访问、修改、状态变更时间)、inode 号、设备信息等。其常用选项包括 `-f` 查看文件系统状态、`-t` 以简洁格式输出、`-L` 跟踪符号链接,以及 `-c` 或 `--format` 自定义输出格式。通过这些选项,用户可以灵活获取所需信息,适用于系统调试、权限检查、磁盘管理等场景。
279 137
|
2月前
|
安全 Ubuntu Unix
一、初识 Linux 与基本命令
玩转Linux命令行,就像探索一座新城市。首先要熟悉它的“地图”,也就是/根目录下/etc(放配置)、/home(住家)这些核心区域。然后掌握几个“生存口令”:用ls看周围,cd去别处,mkdir建新房,cp/mv搬东西,再用cat或tail看文件内容。最后,别忘了随时按Tab键,它能帮你自动补全命令和路径,是提高效率的第一神器。
625 57
|
1月前
|
存储 安全 Linux
Linux卡在emergency mode怎么办?xfs_repair 命令轻松解决
Linux虚拟机遇紧急模式?别慌!多因磁盘挂载失败。本文教你通过日志定位问题,用`xfs_repair`等工具修复文件系统,三步快速恢复。掌握查日志、修磁盘、验重启,轻松应对紧急模式,保障系统稳定运行。
322 2
|
2月前
|
缓存 监控 Linux
Linux内存问题排查命令详解
Linux服务器卡顿?可能是内存问题。掌握free、vmstat、sar三大命令,快速排查内存使用情况。free查看实时内存,vmstat诊断系统整体性能瓶颈,sar实现长期监控,三者结合,高效定位并解决内存问题。
201 0
Linux内存问题排查命令详解
|
2月前
|
Unix Linux 程序员
Linux文本搜索工具grep命令使用指南
以上就是对Linux环境下强大工具 `grep` 的基础到进阶功能介绍。它不仅能够执行简单文字查询任务还能够处理复杂文字处理任务,并且支持强大而灵活地正则表达规范来增加查询精度与效率。无论您是程序员、数据分析师还是系统管理员,在日常工作中熟练运用该命令都将极大提升您处理和分析数据效率。
224 16
|
3月前
|
Linux 网络安全 开发工具
技术栈:这50条最常用的 Linux 命令你一定要会!
建议多在终端中实践,遇到不懂的命令就用 man 或 --help 了解详情!
488 0
|
3月前
|
安全 Linux Shell
Linux系统中sudo命令的高效运用技巧。
用户可以通过sudo -l来列出自己目前可执行的命令列表,这有助于用户了解自己的权限范围。
165 0
|
3月前
|
监控 Linux Shell
linux命令
常用 Linux 命令汇总
|
4月前
|
Linux C++
每天一个linux命令(8):cp 命令
cp 命令是 Linux 中用于复制文件或目录的命令。它的名字来源于英文单词 copy。这个命令非常常用,特别是在需要备份文件或创建文件副本时。
227 0