starrocks version: 2.3.3
3fe + 5be
使用supervisor做保活
情况说明:
be由于oom宕掉后,很快由supervisor拉起,但是通过 show proc ‘/backends’ 查看 isalive依然是false. 此时的 lastestarttime 和lastheartbeattime都是null, 查看所有fe的日志,也没看到hbresponse标记be为alive。
此时只能通过重启fe来刷新heartbeat. 重启master也不够需要全部节点重启。刷新heartbeat后,lastestarttime/lastheartbeattime又不为null。
这样就比较麻烦了。保活等于无效。望解答支持