无法修复的 unhealthyTablet

【详述】如图,当前一个三副本的表,有两个副本的所在的 backend 已经下掉了,但是对应的 backend-Id 仍然是旧的backend,现在这个表的所有 tabets 都是 unhealthy tablets,无法插入数据。

  1. 已使用过 ADMIN REPAIR TABLE table_name 指令,但没有效果
  2. 已使用过 ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "8597230", "backend_id" = "6630327", "status" = "bad"); 尝试让 starrocks 自动修复,也无效果

这个表的所有 tablets 的状态:

这个表tablets的数据分布:

当前集群的be节点

负载状态

很多待修复的tabets状态也是 CANCELD,说是 unable to find source replica,这种就无法修复了吗


【StarRocks版本】例如:2.2.1

现在怎么修复比较好

3副本的表剩一个副本了是不能写入的,你现在pending的任务太多了,会有一段时间系统clone,现在查询是可以正常查的吧,可以手动将其他两个坏掉的副本状态置为bad,会在队列里排队修复,可以关注clueter balance中pengding的指标是否在减小

  1. 对现在是可以查询的
  2. 但是昨天已经手动将一个 tablet 的其他两个副本状态设置为 bad,也无法修复,还是说要将该表的所有 tablets 损坏的副本状态都设置为bad
  3. show proc '/cluster_balance/history_tablets' 显示任务都是被 CANCELED,并没有完成,错误信息是:unable to find source replica,而且 running_tablets 总是0

StarRocks是什么版本

版本是 2.2.1

这种情况除了重新创建表还有别的方案吗

表示我们也是这样的

BE 是强制下线的吗,直接 drop 的? 没有走 decommission?另外 drop 的是哪两个 be?