be节点CPU使用率倾斜,必定有一个节点CPU使用率远高于其他节点

【详述】在有几十个并发查询的情况下,pipeline_dop设置为0时,所有be节点的cpu使用率会到70%以上,单条SQL的查询时间在15秒以上,QPS在10以下;pipeline_dop设置为1时,只有一个be节点的cpu使用率达到90%,其他be节点cpu使用率在20%左右,查询速度可以在10秒以内,QPS在30-50之间。把所有查询都停了,单独只执行一条SQL,查询速度在1秒以内。
【背景】查看分区的桶文件分布,从数量上看是均匀分布在各个be节点上的。
【业务影响】pipeline_dop设置为0,各节点CPU使用率均匀,但查询缓慢;pipeline_dop设置为1,查询快一些,但cpu使用率倾斜。尝试将pipeline_dop设置为4,8,16;当pipeline_dop>=8时,效果和pipeline_dop=0差不多。
【是否存算分离】否
【StarRocks版本】3.4.0
【集群规模】3fe(1Leader + 2 follower)+5be(fe与be混部)
【机器信息】192C/256G/万兆
【联系方式】社区群13-北冥有鱼;360186692@qq.com
【附件】

pipeline_dop 并大度只有1的话,会不会是只取单个be里面的副本呢,所以这个时候实际上只有1个be在工作,其他的在偷懒。

@trueeyu 大佬有收到过类似的问题吗?
我最近使用的版本是3.1.13,暂时没有调整过生产的pipeline_dop参数,也没出现过这种奇葩问题。

pipeline_dop设置为0,各节点CPU使用率均匀,但查询缓慢,可能是由于单个查询会启动多个并行线程可能会出现竞争。pipeline_dop设置为1,查询快一些,但cpu使用率倾斜,这点我也有点认同楼上说的,查询命中热点导致大部分查询集中在单节点。