fe挂掉,拉不起来,踢出去,加进来报错

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】问题详细描述
【背景】做过哪些操作?
【业务影响】
【是否存算分离】
【StarRocks版本】例如:2.5.6
【集群规模】例如:3fe(1 follower+2observer)+5be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】

  • fe.log/beINFO/相应截图
  • 慢查询:
    • Profile信息
    • 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
    • pipeline是否开启:show variables like ‘%pipeline%’;
    • be节点cpu和内存使用率截图
  • 查询报错:
  • be crash
  • 外表查询报错
    • be.out和fe.warn.log

集群有3台fe,有两台fe挂掉了 拉起来一直加不到进去,就删除了两个flower,留了一台leader

重新加入flower

1 ALTER SYSTEM drop follower “xx”
2 删除fe源数据文件,
3 bin/start_fe.sh --helper “leaderIp:9010” --daemon
4 ALTER SYSTEM ADD FOLLOWER “xxx:9010”;
报错如下

搞定了,将leader节点及挂掉的两个节点的 fe.conf 中的 metadata_failure_recovery=true 配置项删除,然后重启这个 leader fe
到另外两台 挂掉的fe 上 清空 meta目录 用–helper 的方式加入集群就可以了

metadata_failure_recovery这个参数是干嘛用的?看官网就一句话