关于Pacemaker集群配置的版本-php手册-PHP中文网

关于Pacemaker集群配置的版本

1. 手册说明

2.实际验证

2.1 环境

2.2 基本验证

2.4 分区验证2

3.总结

首页

php教程

php手册

关于Pacemaker集群配置的版本

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 am 08:42 AM

android

关于Pacemaker集群配置的版本

Pacemaker中CIB有一个由admin_epoch, epoch, num_updates组合而成的版本，当有节点加入集群时，根据版本号的大小，取其中版本最大的作为整个集群的统一配置。

admin_epoch, epoch, num_updates这3者中，admin_epoch通常是不会变的，epoch在每次"配置"变更时累加并把num_updates置0，num_updates在每次"状态"变更时累加。"配置"指持久的CIB中configuration节点下的内容，包括cluster属性，node的forever属性，资源属性等。"状态"指node的reboot属性，node死活，资源是否启动等动态的东西。

"状态"通常是可以通过monitor重新获取的（除非RA脚本设计的有问题），但"配置"出错可能会导致集群的故障，所以我们更需要关心epoch的变更以及节点加入后对集群配置的影响。尤其一些支持主从架构的RA脚本会动态修改配置(比如mysql的mysql_REPL_INFO
和pgsql的pgsql-data-status)，一旦配置处于不一致状态可能会导致集群故障。

1. 手册说明

http://clusterlabs.org/doc/en-US/Pacemaker/1.1-plugin/html-single/Pacemaker_Explained/index.html#idm140225199219024

3.2.Configuration Version When a node joins the cluster, the cluster will perform a check to see who has the best configuration based on the fields below. It then asks the node with the highest (admin_epoch,epoch,num_updates) tuple to replace the configuration on all the nodes - which makes setting them, and setting them correctly, very important.

Table3.1.Configuration Version Properties

Field	Description
admin_epoch	Never modified by the cluster. Use this to make the configurations on any inactive nodes obsolete.Never set this value to zero, in such cases the cluster cannot tell the difference between your configuration and the "empty" one used when nothing is found on disk.
epoch	Incremented every time the configuration is updated (usually by the admin)
num_updates	Incremented every time the configuration or status is updated (usually by the cluster)

2.实际验证

2.1 环境

3台机器，srdsdevapp69，srdsdevapp71和srdsdevapp73
OS: CentOS 6.3
Pacemaker: 1.1.14-1.el6 (Build: 70404b0)
Corosync: 1.4.1-7.el6

2.2 基本验证

0. 初始时epoch="48304"，num_updates="4"

[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

1. 更新集群配置导致epoch加1并将num_updates清0

[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo1 -v "1"
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

2. 更新值如果和现有值相同epoch不变

[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo1 -v "1"
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

3. 更新生命周期为forever的节点属性也导致epoch加1

[root@srdsdevapp69 mysql_ha]# crm_attribute -N `hostname` -l forever -n foo2 -v 2
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

4. 更新生命周期为reboot的节点属性导致num_updates加1

[root@srdsdevapp69 mysql_ha]# crm_attribute -N `hostname` -l reboot -n foo3 -v 2
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

2.3 分区验证

1. 人为造成srdsdevapp69和其它两个节点的网络隔离形成分区,分区前的DC(Designated Controller)为srdsdevapp73

[root@srdsdevapp69 mysql_ha]# iptables -A INPUT -j DROP -s srdsdevapp71
[root@srdsdevapp69 mysql_ha]# iptables -A OUTPUT -j DROP -s srdsdevapp71
[root@srdsdevapp69 mysql_ha]# iptables -A INPUT -j DROP -s srdsdevapp73
[root@srdsdevapp69 mysql_ha]# iptables -A OUTPUT -j DROP -s srdsdevapp73

两个分区上的epoch都没有变，仍是48306,但srdsdevapp69将自己作为了自己分区的DC 。

分区1(srdsdevapp69) : 未取得QUORUM

[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

分区2(srdsdevapp71,srdsdevapp73) : 取得QUORUM

[root@srdsdevapp71 ~]# cibadmin -Q |grep epoch

2. 在srdsdevapp69上做2次配置更新，使其epoch增加2

[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo4 -v "1"
[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo5 -v "1"
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch

3.在srdsdevapp71上做1次配置更新，使其epoch增加1

[root@srdsdevapp71 ~]# crm_attribute --type crm_config -s set1 --name foo6 -v "1"
[root@srdsdevapp71 ~]# cibadmin -Q |grep epoch

4.恢复网络再检查集群的配置

[root@srdsdevapp69 mysql_ha]# iptables -F
[root@srdsdevapp69 mysql_ha]# cibadmin -Q |grep epoch
[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo5 -q
1
[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo4 -q
1
[root@srdsdevapp69 mysql_ha]# crm_attribute --type crm_config -s set1 --name foo6 -q
Error performing operation: No such device or address

可以发现集群采用了srdsdevapp69分区的配置,因为它的版本更大，这时在srdsdevapp71,srdsdevapp73分区上所做的更新丢失了。
这个测试反映了一个问题：取得QUORUM的分区配置可能会被未取得QUORUM的分区配置覆盖。如果自己开发RA的话，这是一个需要注意的问题。

2.4 分区验证2

前一个测试中，产生分区前的DC在取得QUORUM的分区中，现在再试一下产生分区前的DC在未取得QUORUM的分区中的场景。

1. 人为造成DC(srdsdevapp73)和其它两个节点的网络隔离形成分区

[root@srdsdevapp73 ~]# iptables -A INPUT -j DROP -s srdsdevapp69
[root@srdsdevapp73 ~]# iptables -A OUTPUT -j DROP -s srdsdevapp69
[root@srdsdevapp73 ~]# iptables -A INPUT -j DROP -s srdsdevapp71
[root@srdsdevapp73 ~]# iptables -A OUTPUT -j DROP -s srdsdevapp71

srdsdevapp73上epoch没有变

[root@srdsdevapp73 ~]# cibadmin -Q |grep epoch

但另一个分区(srdsdevapp69,srdsdevapp71)上的epoch加1了

[root@srdsdevapp69 ~]# cibadmin -Q |grep epoch

恢复网络后集群采用了版本号更高的配置，DC仍然是分区前的DC(srdsdevapp73)

[root@srdsdevapp73 ~]# iptables -F
[root@srdsdevapp73 ~]# cibadmin -Q |grep epoch

通过这个测试可以发现：

DC协商会导致epoch加1
分区恢复后，Pacemaker倾向于使分区前的DC作为新的DC

3.总结

Pacemaker的行为特征

CIB配置变更会导致epoch加1
DC协商会导致epoch加1
分区恢复后，Pacemaker采取版本号大的作为集群的配置
分区恢复后，Pacemaker倾向于使分区前的DC作为新的DC

开发RA的注意点

尽量避免动态修改集群配置
如果做不到第一点，尽量避免使用多个动态集群配置参数，比如可以把多个参数拼接成一个（mysql的mysql_REPL_INFO就是这么干的）
检查crm_attribute的出错并重试(pgsql就是这么干的)
失去quorum时的资源停止处理(demote，stop)中避免修改集群配置

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7469

CakePHP 教程

1376

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

新报告对传闻中的三星 Galaxy S25、Galaxy S25 Plus 和 Galaxy S25 Ultra 相机升级进行了严厉的评估 Sep 12, 2024 pm 12:23 PM

最近几天，Ice Universe 不断披露有关 Galaxy S25 Ultra 的详细信息，人们普遍认为这款手机将是三星的下一款旗舰智能手机。除此之外，泄密者声称三星只计划升级一款相机

三星 Galaxy S25 Ultra 泄露了第一张渲染图，传闻中的设计变化被曝光 Sep 11, 2024 am 06:37 AM

OnLeaks 现在与 Android Headlines 合作，首次展示了 Galaxy S25 Ultra，几天前，他试图从他的 X（以前的 Twitter）粉丝那里筹集到 4,000 美元以上的资金，但失败了。对于上下文，嵌入在 h 下面的渲染图像

IFA 2024 | TCL 的 NXTPAPER 14 在性能上无法与 Galaxy Tab S10 Ultra 相媲美，但在尺寸上几乎可以与之媲美 Sep 07, 2024 am 06:35 AM

除了发布两款新智能手机外，TCL 还发布了一款名为 NXTPAPER 14 的新 Android 平板电脑，其大屏幕尺寸是其卖点之一。 NXTPAPER 14 采用 TCL 标志性品牌哑光液晶面板 3.0 版本

新报告对传闻中的三星 Galaxy S25、Galaxy S25 Plus 和 Galaxy S25 Ultra 相机升级进行了严厉的评估 Sep 12, 2024 pm 12:22 PM

Vivo Y300 Pro 在 7.69 毫米纤薄机身中配备 6,500 mAh 电池 Sep 07, 2024 am 06:39 AM

Vivo Y300 Pro刚刚全面亮相，它是最薄的中端Android手机之一，配备大电池。准确来说，这款智能手机的厚度仅为 7.69 毫米，但配备了 6,500 mAh 的电池。这与最近推出的容量相同

三星 Galaxy S24 FE 预计将以低于预期的价格推出，有四种颜色和两种内存选项 Sep 12, 2024 pm 09:21 PM

三星尚未就何时更新其 Fan Edition (FE) 智能手机系列提供任何提示。目前来看，Galaxy S23 FE 仍然是该公司的最新版本，于 2023 年 10 月年初推出。

小米红米 Note 14 Pro Plus 上市，成为首款配备 Light Hunter 800 摄像头的高通 Snapdragon 7s Gen 3 智能手机 Sep 27, 2024 am 06:23 AM

Redmi Note 14 Pro Plus 现已正式成为去年 Redmi Note 13 Pro Plus 的直接后继产品（亚马逊售价 375 美元）。正如预期的那样，Redmi Note 14 Pro Plus与Redmi Note 14和Redmi Note 14 Pro一起成为Redmi Note 14系列的主角。李

摩托罗拉 Razr 50s 在早期泄露中显示自己可能是新的预算可折叠手机 Sep 07, 2024 am 09:35 AM

摩托罗拉今年发布了无数设备，尽管其中只有两款是可折叠的。就上下文而言，虽然世界上大多数地区都收到了 Razr 50 和 Razr 50 Ultra，但摩托罗拉在北美提供了 Razr 2024 和 Razr 2

See all articles

关于Pacemaker集群配置的版本

关于Pacemaker集群配置的版本

1. 手册说明

2.实际验证

2.1 环境

2.2 基本验证

2.3 分区验证

2.4 分区验证2

3.总结

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题