频发leader 假死,集群不可用

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】频发leader 假死,然后集群不可用,不可写入数据,也不可查询
【背景】业务增长,写入量增加
【业务影响】leader连接不上,不可写入,不可查询
【是否存算分离】否
【StarRocks版本】3.1
【集群规模】3fe(2 follower)+5be(fe与be混部)
【机器信息】8c/64g
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 9001 qdisc mq state UP mode DEFAULT group default qlen 1000
link/ether 06:5a:b4:5e:7a:a6 brd ff:ff:ff:ff:ff:ff
【联系方式】toe.xie@cmexpro.com
【附件】

  • 慢查询:
    • Profile信息
    • 并行度:
      | parallel_fragment_exec_instance_num | 1 |
    • pipeline是否开启:
      ±--------------------------------±------+
      | Variable_name | Value |
      ±--------------------------------±------+
      | enable_pipeline_engine | true |
      | enable_pipeline_query_statistic | true |
      | max_pipeline_dop | 64 |
      | pipeline_dop | 2 |
      | pipeline_profile_level | 1 |
      | pipeline_sink_dop | 0 |
      ±--------------------------------±------+
    • be节点cpu和内存使用率截图


  • 查询报错:
  • be crash
  • 外表查询报错
    • be.out和fe.warn.log

补充,be也会经常dead。