slowdblock导致compaction不能够进行

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】多个集群都出现过slowdblock导致不能够compaction引起的慢查询问题
【背景】无
【业务影响】查询变慢
【是否存算分离】是
【StarRocks版本】例如:3.2.5
【现象】:fe没有compaction相关的日志
【报错信息】:
lockHoldTime: 67831560 ms;dump thread: StarMgrMetaSyncer, id: 50
java.base@17.0.7/jdk.internal.misc.Unsafe.park(Native Method)
java.base@17.0.7/java.util.concurrent.locks.LockSupport.park(LockSupport.java:211)
app//io.grpc.stub.ClientCalls$ThreadlessExecutor.waitAndDrain(ClientCalls.java:717)
app//io.grpc.stub.ClientCalls.blockingUnaryCall(ClientCalls.java:159)
app//com.staros.proto.StarManagerGrpc$StarManagerBlockingStub.listShard(StarManagerGrpc.java:2117)
app//com.staros.client.StarClient.lambda$listShard$21(StarClient.java:518)
app//com.staros.client.StarClient$$Lambda$1715/0x0000000801855000.call(Unknown Source)
app//com.staros.client.StarClient.internalRpcCall(StarClient.java:767)
app//com.staros.client.StarClient.listShard(StarClient.java:518)
app//com.staros.client.StarClient.listShard(StarClient.java:490)
app//com.starrocks.lake.StarOSAgent.listShard(StarOSAgent.java:499)
app//com.starrocks.lake.StarMgrMetaSyncer.syncTableMetaInternal(StarMgrMetaSyncer.java:288)
app//com.starrocks.lake.StarMgrMetaSyncer.syncTableMetaAndColocationInfoInternal(StarMgrMetaSyncer.java:351)
app//com.starrocks.lake.StarMgrMetaSyncer.syncTableMetaAndColocationInfo(StarMgrMetaSyncer.java:253)
app//com.starrocks.lake.StarMgrMetaSyncer.runAfterCatalogReady(StarMgrMetaSyncer.java:362)
app//com.starrocks.common.util.FrontendDaemon.runOneCycle(FrontendDaemon.java:72)
app//com.starrocks.common.util.Daemon.run(Daemon.java:107)
【堆栈信息】check.data (940.9 KB)

从当前信息来看,关键问题在于 StarMgrMetaSyncer 线程在执行同步元数据的过程中遇到了长时间的锁持有 ( lockHoldTime: 67831560 ms ),导致系统响应变慢或卡住了 这个是什么版本? 可以再发下监控中关于compaction的信息 然后去到be上检索下 grep -E 'compaction.score=[5-9]{2,}’ be.INFO|tail -100

1、版本:3.2.5,三个集群不同时间都出现这个问题
2、3.X 没有自己的compaction的metric,另外我们从元数据中找到MAX_CS到了几千;获取方式:
select DB_NAME,TABLE_NAME,PARTITION_NAME,DATA_SIZE,MAX_CS from information_schema.partitions_meta order by Max_CS desc limit 1;
3、be相关的日志已经没有了,只能下次出现问题的时候才能去查看这个日志。另外grep的关键词是不是写错了? compaction. score

有大佬帮忙跟进该问题吗?