【是否存算分离】否
【StarRocks版本】2.4.5
【集群规模】1fe+4be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,12C/32G千兆
【联系方式】StarRocks社区群 7-mile
【附件】
从1.x版本一路升级上来,隔一段时间fe就会挂掉,上次挂掉是1-22晚上20:38分左右,看日志也没发现原因,请问这是什么导致的?和资源有关系吗?除了sr,集群有部署hadoop相关服务。fe.log.20240122-1 (26.5 MB) fe.out (39.0 MB)
有部署yarn 任务吗
什么定时任务都没有,就在后台挂着,周五放假,一般周一回来就会发现挂了,期间没人用
麻烦看下dmesg -T |grep oom的输出
大概率是机器内存不够oom了,可以看下内存监控,fe重启的时间点是否有内存比较高
想问下那这种问题就没有办法避免了吗?只能通过加内存的方式?机器没有监控,但是free -h这台机器确实可用内存非常少,应该是这个原因
测试环境的话,那就只能规划一下当前机器上运行程序的内存了,可以通过top看下哪些程序内存占用较高。
fe的内存控制可以通过配置fe.conf里的JAVA_OPTS里的-Xmx8192m,默认8G