查询报错: Build Exec OlapScanNode fail, scan info is invalid,Failed to get scan range, no queryable replica found in tablet

【详述】现象是部分表执行select 时报错: Build Exec OlapScanNode fail, scan info is invalid,Failed to get scan range, no queryable replica found in tablet
查看 be.WARN日志,会不断地打印类似 W0326 17:48:14.692698 1338 socket.cpp:1227] Fail to wait EPOLLOUT of fd=896: Connection timed out [110]
【背景】
K8S helm 部署 kube-starrocks-1.9.1

  1. 3月22日 07点,一个Node宕机重启;该Node上的be-1/fe-2 随之重启;但同时fe-0 (当时的leader)出现故障并重启
  2. 由于fe-0/fe-2 重启几乎同时重启,FE失去leader 、SR实例处于不可用状态(be-1也不停重启)。
  3. 3月21日从fe-1 备份meta,手动重建fe-0。 期间可能因为helm的影响 fe-1没加入FE HA集群,自己成为leader 。出现脑裂现象,SR实例仍然不可用。
  4. 3月25日再次从备份meta里重建FE。 本次从helm 修改value逐步停止FE,恢复、重启fe-0,逐个启动fe-1,fe-2后,FE 正常
  5. 连接查看fe/be 状态均alive=true,但部分表执行select 报错、无法读写
  6. 尝试创建repo后,对上述表执行backup,同样失败。

【业务影响】 测试环境,希望弄清查询失败原因,避免在生产环境出现。
【是否存算分离】 否
【StarRocks版本】2.5.18
【集群规模】3fe(3 follower)+3be(fe与be混部)
【机器信息】32C/128G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】