在Keepalived集群中,其實并沒有嚴格意義上的主、備節(jié)點,雖然可以在Keepalived配置文件中設置“state”選項為“MASTER”狀態(tài),但是這并不意味著此節(jié)點一直就是Master角色。控制節(jié)點角色的是Keepalived配置文件中的“priority”值,但并它并不控制所有節(jié)點的角色,另一個能改變節(jié)點角色的是在vrrp_script模塊中設置的“weight”值,這兩個選項對應的都是一個整數值,其中“weight”值可以是個負整數,一個節(jié)點在集群中的角色就是通過這兩個值的大小決定的。
在一個一主多備的Keepalived集群中,“priority”值最大的將成為集群中的Master節(jié)點,而其他都是Backup節(jié)點。在Master節(jié)點發(fā)生故障后,Backup節(jié)點之間將進行“民主選舉”,通過對節(jié)點優(yōu)先級值“priority”和““weight”的計算,選出新的Master節(jié)點接管集群服務。
在vrrp_script模塊中,如果不設置“weight”選項值,那么集群優(yōu)先級的選擇將由Keepalived配置文件中的“priority”值決定,而在需要對集群中優(yōu)先級進行靈活控制時,可以通過在vrrp_script模塊中設置“weight”值來實現。下面列舉一個實例來具體說明。
假定有A和B兩節(jié)點組成的Keepalived集群,在A節(jié)點keepalived.conf文件中,設置“priority”值為100,而在B節(jié)點keepalived.conf文件中,設置“priority”值為80,并且A、B兩個節(jié)點都使用了“vrrp_script”模塊來監(jiān)控mysql服務,同時都設置“weight”值為10,那么將會發(fā)生如下情況。
在兩節(jié)點都啟動Keepalived服務后,正常情況是A節(jié)點將成為集群中的Master節(jié)點,而B自動成為Backup節(jié)點,此時將A節(jié)點的mysql服務關閉,通過查看日志發(fā)現,并沒有出現B節(jié)點接管A節(jié)點的日志,B節(jié)點仍然處于Backup狀態(tài),而A節(jié)點依舊是Master狀態(tài),在這種情況下整個HA集群將失去意義。
下面就分析一下產生這種情況的原因,這也就是Keepalived集群中主、備角色選舉策略的問題。下面總結了在Keepalived中使用vrrp_script模塊時整個集群角色的選舉算法,由于“weight”值可以是正數也可以是負數,因此,要分兩種情況進行說明。
1. “weight”值為正數時
在vrrp_script中指定的腳本如果檢測成功,那么Master節(jié)點的權值將是“weight值與”priority“值之和,如果腳本檢測失敗,那么Master節(jié)點的權值保持為“priority”值,因此切換策略為:
Master節(jié)點“vrrp_script”腳本檢測失敗時,如果Master節(jié)點“priority”值小于Backup節(jié)點“weight值與”priority“值之和,將發(fā)生主、備切換。
Master節(jié)點“vrrp_script”腳本檢測成功時,如果Master節(jié)點“weight”值與“priority”值之和大于Backup節(jié)點“weight”值與“priority”值之和,主節(jié)點依然為主節(jié)點,不發(fā)生切換。
2. “weight”值為負數時
在“vrrp_script”中指定的腳本如果檢測成功,那么Master節(jié)點的權值仍為“priority”值,當腳本檢測失敗時,Master節(jié)點的權值將是“priority“值與“weight”值之差,因此切換策略為:
Master節(jié)點“vrrp_script”腳本檢測失敗時,如果Master節(jié)點“priority”值與“weight”值之差小于Backup節(jié)點“priority”值,將發(fā)生主、備切換。
Master節(jié)點“vrrp_script”腳本檢測成功時,如果Master節(jié)點“priority”值大于Backup節(jié)點“priority”值時,主節(jié)點依然為主節(jié)點,不發(fā)生切換。
在熟悉了Keepalived主、備角色的選舉策略后,再來分析一下剛才實例,由于A、B兩個節(jié)點設置的“weight”值都為10,因此符合選舉策略的第一種,在A節(jié)點停止Mysql服務后,A節(jié)點的腳本檢測將失敗,此時A節(jié)點的權值將保持為A節(jié)點上設置的“priority”值,即為100,而B節(jié)點的權值將變?yōu)?#8220;weight”值與“priority”值之和,也就是90(10+80),這樣就出現了A節(jié)點權值仍然大于B節(jié)點權值的情況,因此不會發(fā)生主、備切換。
對于“weight”值的設置,有一個簡單的標準,即“weight”值的絕對值要大于Master和Backup節(jié)點“priority”值之差。對于上面A、B兩個節(jié)點的例子,只要設置“weight”值大于20即可保證集群正常運行和切換。由此可見,對于“weight值的設置,要非常謹慎,如果設置不好,將導致集群角色選舉失敗,使集群陷于癱瘓狀態(tài)。