BE节点突然同一时间挂掉

这个是tablet banlance迁移的日志,可能是tablet迁移占用的IO比较多

可以怎么处理这种问题呢?这种时快时慢的问题,排查了几天了 :joy:

show proc ‘/cluster_balance’; 执行一下这个看看

ADMIN SET FRONTEND CONFIG (“max_scheduling_tablets” = “0”);
ADMIN SET FRONTEND CONFIG (“max_balancing_tablets” = “0”);

这两个是调整balance并行度的,可以调低点看看

我们现在是这样设置的,设置的也不大企业微信截图_16911381799430

ADMIN SET FRONTEND CONFIG (“max_scheduling_tablets” = “1”);
ADMIN SET FRONTEND CONFIG (“max_balancing_tablets” = “1”);

这两个值先都改成 1 看看

把这个参数分别设置为1和2慢查询profile,辛苦看看是什么原因导致的?pipeline_profile_level=1慢profile.txt|attachment (87.8 KB) pipeline_profile_level=2慢profile.txt|attachment (1.5 MB)

set pipeline_profile_level=1,大概耗时2m20s
set pipeline_profile_level=2,大概耗时3m

explain计划.txt (466.7 KB)

开了查询队列了吗,我升级2.5版本的时候开了查询队列出现问题就是查询都进不来,关了就好了

查询队列都是关闭的
image

还有个四分钟的慢profile
4分钟的慢profile.txt (87.5 KB)

大佬,这个慢profile可以帮忙看看么?
profile.txt (112.3 KB)