【详述】问题详细描述
【背景】做过哪些操作?
【业务影响】
【StarRocks版本】例如:2.5.1
【集群规模】例如:3fe(3 follower)+5be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】
问题:从2.2.10升级到2.5.1 后,fe 主节点没有问题,fe 两个follower 节点的内存持续升值,直到oom,最终导致两个fe follower 挂掉,整个集群不可以,通过监控查看 follower fe jvm gcc 次数比fe master 节点次数少一倍以上。
表现:fe master 内存old 区域能正常回收
fe follower 内存old区域不能正常回收,并持续升高,
2个follower 不可用,最终导致fe master 也挂掉。