一、redis集群檢測(cè)方法
1、使用redis-cli登錄正常節(jié)點(diǎn);
2、使用cluster info命令查看集群狀態(tài),最重要的字段,cluster_state:ok,說(shuō)明集群正常;
3、另外可以使用cluster nodes查看哪些節(jié)點(diǎn)fail;
二、redis集群恢復(fù)方法
如果有告警或者發(fā)現(xiàn)集群有節(jié)點(diǎn)進(jìn)程丟失,請(qǐng)按照以下步驟處理:
步驟一、集群中有節(jié)點(diǎn)有進(jìn)程掛掉,優(yōu)先重啟進(jìn)程;
實(shí)驗(yàn)中3主3從的集群,6個(gè)節(jié)點(diǎn)進(jìn)程全部掛掉情況下,一次重啟節(jié)點(diǎn)進(jìn)程,redis集群還能恢復(fù);
步驟二、如果按照步驟一集群節(jié)點(diǎn)沒(méi)有恢復(fù),那么就要重建集群
1、一次殺掉集群所有節(jié)點(diǎn)的進(jìn)程;
2、重建集群配置,以redis5為例
redis-cli [-a xxx] --cluster create --cluster-replicas 1 node_ip_1:port_1 1node_ip_2:port_2 node_ip_3:port_3 node_ip_4:port_4 node_ip_5:port_5 node_ip_6:port_6
可能報(bào)錯(cuò),處理方法:刪除data、log、node.conf等文件,重新構(gòu)建集群。
備注:[-a xxx] redis密碼