【详述】be节点于2023年1月31日23:03分突然挂掉,于2023年2月1日09:26分尝试重启,但未启动成功。然后将be版本由2.4.1 升级到了 2.4.3,于2023年2月1日10:05分再次尝试重启,依然无法启动成功。
【背景】无任何操作。
【业务影响】
【StarRocks版本】例如:2.4.1
【集群规模】例如:3fe(1 follower+2observer)+3be(fe与be混部)
【机器信息】12C/128G/千兆
【联系方式】sun_weixing@itrus.com.cn
【表模型】:主键模型
【附件】
be.INFO (24.1 KB)
be.out (3.5 KB)
be.WARNING (2.0 KB)
需要先手动用metatool删除下错误tablet的persistent index再启动
2.4.3彻底解决了这个问题,但是2.4.1已出现了,需要手动处理下
找到导致crash的tablet,在be目录下执行./bin/meta_tool.sh --operation=delete_persistent_index_meta --root_path=$storage_path --tablet_id=$tablet_id,删除错误的persistent index再启动
处理好恢复了吗?
您好,如何定位导致crash的tablet啊。
您好,如何定位导致crash的tablet啊。
加你微信了,通过下
需要 ulimit -c unlimited 打开core,通过core文件找到有问题的tablet id