后续:通过排查是其中一张表(就是图片中的这个表)tablet坏掉了,情况如下:
TabletId |
ReplicaId |
BackendId |
Version |
LastFailedVersion |
LastSuccessVersion |
CommittedVersion |
SchemaHash |
VersionNum |
IsBad |
IsSetBadForce |
State |
Status |
16628235 |
77170118 |
13032 |
26988058 |
-1 |
26988058 |
26987057 |
0 |
6 |
false |
false |
NORMAL |
OK |
16628235 |
77173296 |
35335752 |
26987057 |
26988058 |
26987057 |
26987057 |
0 |
4 |
true |
true |
DECOMMISSION |
DEAD |
16628237 |
77169939 |
13032 |
26987134 |
26988058 |
26987134 |
26987057 |
0 |
10 |
true |
true |
DECOMMISSION |
DEAD |
16628237 |
77173923 |
35335752 |
26988058 |
-1 |
26988058 |
26987057 |
0 |
8 |
false |
false |
NORMAL |
OK |
我使用了下方的两条命令,期望可以修复副本,但是可惜的是并没有任何反应,最后的状态就如上面的图表。
ADMIN SHOW REPLICA STATUS FROM data_location_wsd;
-- 设置副本为bad
ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "945137", "backend_id" = "11158", "status" = "bad");
这是使用到的脚本;
其他的情况:这张表查询也执行不了,使用select * from table;会报错:
[Err] 1064 - Build Exec OlapScanNode fail, scan info is invalid,Failed to get scan range, no queryable replica found in tablet: 16628237 13032:26987134/26988058/26987134/26986259:DECOMMISSION35335752:26988058/-1/26988058/26987133:NORMAL
最后的解决方案:我们删除了这张表,因为无法回复数据,所以所有的数据也丢失了。
记录一下以后有相关的解决方案再补充吧。