BE节点报错add batch req rpc failed

【详述】问题详细描述
晚间5台BE同一时间点都报错误,导致挂了,详见截图

【StarRocks版本】 2.1.3
【集群规模】例如:3fe+5be(fe与be混部)

fe状态是正常的吗?晚间有跑stream load导入任务?

fe状态正常,整天都在跑stream load,只是晚间报这个错误

您好,麻烦在be节点做下这个操作:grep $load_id be.INFO|less

好的,请问咱们是测试环境还是生产环境呢?be挂掉的时候cpu、磁盘io高吗?

生产环境,我看gran监控cpu和磁盘IO都不高,cpu平均不到20%


请问夜间有查询吗?还是说只有导入任务在跑?

没有查询,只有导入同步数据进去

您好,麻烦发一下fe和be的out日志

be.out fe.out

可以升级到2.1的最新版本试试,

fe.out



image

be.out


fe.log
8.11 00:50 fe不可用,经常到凌晨49 50分左右的时候就会出现fe挂了,日志如下

是参数设置还是什么问题,怎么处理?

这个BUG,在最新版本修过了,可以升级到2.1.12

https://github.com/StarRocks/starrocks/pull/4715