3台机器,每天随机BE会挂

以前OOM的原因是 overcommit_memory=0

你配置少了,内存利用不起来,所以可以配置成: mem_limit=28G

可以dmesg -T 把详细信息发下吗

改配置后,需要重启BE

dmesg.log (1.1 MB)

少了几条日志吧,后面

我算了下,除了BE,其它进程占了大约8G内存

(363924+273513+150130+122234+255553+600781+323172+229353)*4/1024/1024 =
8G

和你说的2G,不符合,那么要配置mem_limit=22G (32-8-2)

dolphinscheduler 上还会调datax,可能也会datax也会有占一些内存

可能是22.4大于22导致oom是吗

overcommit_memory=0导致的

这个全部都导出了 dmesg -T > dmesg.log

把这个/proc/sys/vm/overcommit_memory改成1,可以避免

好的感谢,我改完观察下

辛苦观察一段时间后,给我们一个反馈

初步判定 OOM 的原因是: /proc/sys/vm/overcommit_memory=0

/proc/sys/vm/overcommit_memory改成1,再把mem_limit换成65%,be就没挂过了,感谢您的指导