【详述】FE节点oom后执行refresh external table报错
【背景】无
【业务影响】
【是否存算分离】否
【StarRocks版本】2.5.19
【集群规模】3fe(3 follower)+ 23be(fe与be独立部署)
【机器信息】64C/256G/万兆
【联系方式】社区群1-Shogun
9点25分左右,一台FE节点oom,如图所示:

10点开始出现执行refresh external table报错:
在fe日志里可以搜到call fe TNetworkAddress(hostname:, port:9020) refreshTable rpc method failed的报错:
但报错提示中的FE节点一直未宕机,心跳监测状态也正常。
最后11:30分,重启异常FE节点后恢复正常,执行refresh external table不再报错。
异常期间,异常FE节点的thrift-server线程数一直为0: