fe 节点奔溃,out 日志显示oom

【详述】fe 节点奔溃
【背景】flink 数据写入
【业务影响】
【StarRocks版本】例如:2.5.0
【集群规模】例如:3fe(1 follower+2follower)+3be(fe与be 独立部署)
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】社区群6-李桥

warn 日志如下
fe.warn_master.log (7.8 MB) fe.warn_follower.log (243.8 KB)

fe.out 日志如下
fe_follower.out (71.9 KB) fe_master.out (6.1 KB)

只有leader节点出现问题还是所有fe节点都OOM了?当前fe节点内存多大,jvm XMX设置的多大?

leader 节点和一台follwer 节点直接挂掉了,进程已经挂掉。另外一台follower 节点进程查看在,但是在fe.out 日志中也查看到是已经OOM 了。 leader 内存是64G,2个follower 内存是32G 。jvm xmx 是默认参数。

您当前有使用insert into overwrite么

没有呢。上周我直接重启了,然后这周末又oom。

cat /proc/sys/vm/overcommit_memory 看下系统的这个参数是不是1,如果不是的话就改下

这个参数是1,是jvm oom 了

导入数据量、并发、频率高吗?可以适当把jvm参数调大,目前时8G?有没有监控看下当时的cpu、内存、IO和jvm?

我这次先调度到了12G,这周再观察下。因为周末时间数据量会大一点。

调到12G又出现了吗

是的,OOM文件太大了,无法上传,有什么方法发给你们吗

sr2.5.0 版fe 频繁oom 问题,有解决方案吗?升级新版本是否可以完全解决这个问题