BE节点突然同一时间挂掉

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】启动完BE,会突发性BE同时间挂掉
【背景】通过kafka任务存入数据,kafka数据频率较快
【业务影响】数据库运行不稳定BE会同一时间挂掉
【StarRocks版本】3.0.0
【集群规模】3fe(1 follower+2observer)+3be(fe与be 非混部)
【机器信息】CPU虚拟核 24C/64/万兆,例如:48C/64G/万兆
【联系方式】1591105331@qq.com
【附件】

be拉起后还会挂掉吗?be.out的信息是一样的么?dmesg -T | grep starrocks 有结果么?

短时间内不会,但是一周内出现两次了

我恢复be得时候没有保留上次得be.out,我再留一次,dmesg -T | grep starrocks 这个没有结果

又是同一时间三个节点同时挂掉

这次保留了coredump了吗

都有,要怎么发您吗?

我们约个时间直接远程看一下就行

今天下午一点左右可以吗?

startrocks升级完成后,所有的查询有时候均比较慢,前端报表页面点开也卡。不知道是什么原因导致的?可以帮忙解答下吗

从哪个版本升级到哪个版本,cpu io 确认一下是不是用满了,另外弄个慢查询profile

从2.4.0升到了3.0,cpu的io都很充足,连8%都不到,而且这个慢,是时快时慢,当数据库快的时候,查询还是很快的(2-3s),当数据库慢的时候,查询巨慢(几分钟),感觉就是数据库本身不太稳定,没查出根因

弄个慢查询的profile看看

profile.txt (46.5 KB)

 - IOTime: 13s293ms
 - __MAX_OF_IOTime: 1m18s
 - __MIN_OF_IOTime: 0ns

看着是IO消耗比较高. 设置一下这个变量看看

set enable_tablet_internal_parallel=false;

设置了你这个参数之后,还是有那个时快时慢的问题,快的时候不到1s,慢的时候分钟以上 :joy:

我把设置那参数之后,快和慢的profile都发你,麻烦再看看快profile.txt (46.2 KB) 慢profile.txt (46.1 KB)

我怀疑是有慢节点

set pipeline_profile_level=2;

然后再获取一下profile

我们把这个参数的是1,set pipeline_profile_level=1;暂未出现慢查询,出现慢查询时,我把设置为1和2的慢查询profile都发你,在日志中,发现了这些问题,可以看看是什么回事吗?fe.log.txt (2.4 KB) be.INFO.txt (2.0 KB) fe.warn.log.txt (6.1 KB) be.WARNING.txt (5.2 KB)