starrocks fe会不定时宕机

【是否存算分离】否
【StarRocks版本】2.4.5
【集群规模】1fe+4be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,12C/32G千兆
【联系方式】StarRocks社区群 7-mile
【附件】
从1.x版本一路升级上来,隔一段时间fe就会挂掉,上次挂掉是1-22晚上20:38分左右,看日志也没发现原因,请问这是什么导致的?和资源有关系吗?除了sr,集群有部署hadoop相关服务。fe.log.20240122-1 (26.5 MB) fe.out (39.0 MB)

有部署yarn 任务吗

什么定时任务都没有,就在后台挂着,周五放假,一般周一回来就会发现挂了,期间没人用

麻烦看下dmesg -T |grep oom的输出

大概率是机器内存不够oom了,可以看下内存监控,fe重启的时间点是否有内存比较高

想问下那这种问题就没有办法避免了吗?只能通过加内存的方式?机器没有监控,但是free -h这台机器确实可用内存非常少,应该是这个原因

测试环境的话,那就只能规划一下当前机器上运行程序的内存了,可以通过top看下哪些程序内存占用较高。
fe的内存控制可以通过配置fe.conf里的JAVA_OPTS里的-Xmx8192m,默认8G

感谢,这个配置过,拉到了16g,这台机器是be和fe混合部署,基本占用的就是starrocks了,机器本身是32g/12c


image
image
想基于这个问题请教下是不是starroccks对于机器内存的消耗是比cpu要厉害的?我们有不同项目场地评估资源,因为出于数据保密出问题排查很繁琐,如果项目上遇到这种问题是比较致命的。