StarRocks3.1.4FE主节点OOM导致崩溃

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】今天早上9:14左右出现异常,然后FE主节点发生OOM报错,在9:16shut down
【背景】因为周末只有正常的任务处理没有其他异常操作
【业务影响】FE节点崩溃,影响日常任务
【是否存算分离】是
【StarRocks版本】3.1.4
【集群规模】3fe(1leader+2 follower)+7cn
【机器信息】
【联系方式】tanheyuan@sailvan.com
【附件】






麻烦私聊发下当时的fe.log和fe.gc.log,可能是full gc了

已经私信您了~

确实是JVM内存超限了,Caused by: java.lang.OutOfMemoryError: Java heap space。请问当前fe节点的JAVA_OPTS是怎么配置的,可以看下fe.conf

当时确实排查了是内存超限了,使用的是默认的参数8GB,后面改成32GB就没事了,但是我主要想知道是哪部分功能导致的内存超限,是业务数据处理这块还是SR本身内部处理导致的,如果是业务数据的话,我这边可以看看怎么优化一下,如果是SR内部的处理导致的话,我是否要优化其他参数?

一方面是集群元数据,一般随着集群tablet数量的增长,所需的jvm内存也会增加,另一方面是be和fe的通信也会占据一些fe的内存;另外一方面一些大的复杂查询、大结果集输出也可能会导致内存突增进而oom