starrocks be节点启动失败

【详述】starrocks be节点启动失败
【背景】无
【业务影响】生产SR集群不可以
【StarRocks版本】例如:2.3.1
【集群规模】例如:1fe+4be(fe与be单部)
【机器信息】CPU虚拟核/内存/网卡,例如:24C/96G/万兆
【附件】

be.out日志

只有一台be是这个情况吗?集群里的表是否都是三副本?

集群的表都是三副本的,目前4个be节点只有1个be节点启动异常,报上面的错误

什么原因挂的知道吗?上面的warning日志是启动be时打印的?

没看到挂的日志,现在把这个异常的be节点版本更新到2.4.1,就可以正常启动了

这样执行看下
grep F1117 be.INFO*

目前日志只保留2个,上午的日志已经被刷掉了

您好,昨天通过升级到2.4.1后解决启动失败问题,今天发现有部分表查询时报1064 - Bad segment file /data02/data/270/7738033/1691847555/0200000000f6a989504cd705f5b21615cf528110de101087_0.dat: file size 0 < 12,请问这个怎么解决

问题原因:没Flush文件,就更新元数据了。可以在be.conf文件中添加参数sync_tablet_meta=true来避免以后出现该问题,该参数会在2.5版本自动开启,当前删除对应的segment文件

加完重启可以解决目前这个问题么,还是只能避免以后出现这个问题

当前只能避免以后出现这个问题

如果不是单副本的话,可以这样尝试修复下

ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "7738033", "backend_id" = "xxx", "status" = "bad");

backend_id是show backends里面看到的对应be的id