【2.5.11版本】FE节点出现try db lock failed导致无法查询

【详述】FE节点出现try db lock failed,导致无法查询、写入数据
【背景】有一些streamload任务,同步频率为15s,定时任务有一些insert into select 语句,出现问题后停掉所有同步及定时任务,大约2个小时后FE节点恢复,另外通过fe页面statistic查看有unhealthytablets存在,并且一直在做clone动作


18:11分左右出现问题,20:10分左右恢复

FE JVM Threads

【业务影响】
【是否存算分离】
【StarRocks版本】2.5.11
【集群规模】1fe + 3be (单独部署)
【机器信息】1fe 4C16G,3be 16C64G
【联系方式】社区群12-Pumbaa
【附件】
be_warn_10.log (40.7 KB) be_warn_12.log (266.3 KB) be_warn_17.log (33.9 KB) fe_gc.tar.gz (1.1 MB) fe_warn.tar.gz (1.6 MB)

  • 慢查询:
    • Profile信息
    • 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
    • pipeline是否开启:show variables like ‘%pipeline%’;
    • be节点cpu和内存使用率截图

有没有大佬来看下,为什么会出现这种问题,怎么避免啊