【详述】有三节点FE做高可用,昨晚10点半左右发现在full gc ,监控显示已经不能正常工作,于是我kill 掉重新启动加入集群,恢复,今天凌晨又一FE挂了,也是因为fullgc 导致的,OOM 了 ,之后重新启动恢复了,让我纳闷的是,昨晚看监控时,FE leader 节点的堆使用很低,follower 节点(也就是挂掉的那俩节点)堆内存使用很高,这是什么原因导致的? 堆内存设置默认8G, 另外集群开启了增量同步hive 元数据
【StarRocks版本】2.4.0
【集群规模】3fe(3 follower+ 0 observer)+3be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:16C/64G/万兆
【附件】
- fe堆内存截图
- fe.log
- 慢查询:
- Profile信息
- 并行度::
- pipeline是否开启:show variables like ‘%pipeline%’;
- be节点cpu和内存使用率截图
- Profile信息
- gc 日志: