部署高可用集群,FOLLOWER节点启动加入不了

【详述】我有3台阿里云的机器,一台ip最后为44,一个ip最后为47,一台ip最后为48。先启动44,jps查看启动成功,然后使用mysql分别对47和48进行ALTER SYSTEM ADD FOLLOWER操作,分别在47和48机器上执行./bin/start_fe.sh --helper xxx.xx.xx.44:9010 --daemon。分别查看jps显示有StarRocksFE进程。但是在mysql执行 SHOW PROC '/frontends'\G;时,显示只有47的AliveTrue,48的Alive一直是false
【背景】做过哪些操作?
【业务影响】
【StarRocks版本】例如:1.19.1
【集群规模】例如:3fe(3 follower))
【机器信息】CPU虚拟核/内存/网
【附件】



com.sleepycat.je.EnvironmentFailureException: (JE 7.3.7) Environment must be closed, caused by: com.sleepycat.je.EnvironmentFailureException: Environment invalid because of previous exception: (JE 7.3.7) 172.17.72.48_9010_1637131636162(2):/data_lytdev_dir/starrocks/meta/bdb  Feeder: 172.17.72.44_9010_1637131600044(1). Node: 172.17.72.48_9010_1637131636162(2) is no longer a member of the group. It was explicitly removed. HANDSHAKE_ERROR: Error during the handshake between two nodes. Some validity or compatibility check failed, preventing further communication between the nodes. Environment is invalid and must be closed. Originally thrown by HA thread: RepNode 172.17.72.48_9010_1637131636162(-1) Originally thrown by HA thread: RepNode 172.17.72.48_9010_1637131636162(-1)
  1. alter system drop follower ‘***48:9010’;
  2. 把这个fe的meta目录清空。
  3. alter system add follower ‘***48:9010’;
  4. ./bin/start_fe.sh --helper xxx.xx.xx.44:9010 --daemon
1赞

当时我好像这样处理了,不行,后来我把防火墙关闭了,就没再继续处理这个问题,我清空重启好了

好的 是防火墙的问题导致无法进行集群通信了

您好,请问我和他的报错一样,有一个节点查看了防火墙状态是关闭的,且iptables授权了端口号,也清空了meta,还是不行。其他两个就可以

您好,请问我和他的报错一样,有一个节点查看了防火墙状态是关闭的,且iptables授权了端口号,也清空了meta,还是不行。其他两个就可以。