执行refresh external table报错

【详述】FE节点oom后执行refresh external table报错
【背景】无
【业务影响】
【是否存算分离】否
【StarRocks版本】2.5.19
【集群规模】3fe(3 follower)+ 23be(fe与be独立部署)
【机器信息】64C/256G/万兆
【联系方式】社区群1-Shogun

9点25分左右,一台FE节点oom,如图所示:


image

10点开始出现执行refresh external table报错:

在fe日志里可以搜到call fe TNetworkAddress(hostname:, port:9020) refreshTable rpc method failed的报错:

但报错提示中的FE节点一直未宕机,心跳监测状态也正常。
最后11:30分,重启异常FE节点后恢复正常,执行refresh external table不再报错。

异常期间,异常FE节点的thrift-server线程数一直为0:

服务器是256G内存,JVM设置128G,保证JVM=堆外,就不会OOM了

好的,我们调整下