版本 1.4.2
现在有大量tablet状态不正常,数据不能查询,不能写入
有什么方式能修复吗
±-------------------±----------------------±-----------------+
| UnhealthyTabletNum | InconsistentTabletNum | CloningTabletNum |
±-------------------±----------------------±-----------------+
| 13 | 0 | 0 |
| 0 | 0 | 0 |
| 105 | 0 | 0 |
| 400 | 0 | 0 |
| 535 | 0 | 0 |
| 1289 | 0 | 0 |
| 201 | 0 | 0 |
| 1197 | 0 | 0 |
| 906 | 0 | 0 |
| 0 | 0 | 0 |
| 514 | 0 | 0 |
| 85 | 0 | 0 |
| 234 | 0 | 0 |
| 0 | 0 | 0 |
| 1794 | 0 | 0 |
| 17 | 0 | 0 |
| 95 | 0 | 0 |
| 0 | 0 | 0 |
| 0 | 0 | 0 |
| 7 | 0 | 0 |
| 1941 | 0 | 0 |
| 0 | 0 | 0 |
| 0 | 0 | 0 |
| 125 | 0 | 0 |
| 9458 | 0 | 0 |
±-------------------±----------------------±-----------------+
查询报什么错误?
Build Exec OlapScanNode fail, scan info is invalid,16089061have no alive replicas
找不到副本
能不能跳过出问题的tablet,先读取其它正常的tablet数据
表是单副本?有BE挂了?
昨天版本从1.4.1升级到1.4.2, 有两个be节点升级后不能启动,一起来就挂掉,
从be列表里删除,删除storage,重新添加be拉数据,有很多tablet状态不正常
2.4.1升2.4.2?be.out发下?当时建表的时候是创建的单副本的表吗?现在的情况,很可能是副本都丢了啊
3个BE,清了两台?
5台be, drop backend时没有报错
show tablet 16089061;
SHOW PROC ‘/dbs/15899/16089059/partitions/16089058/16089060/16089061’;
-----±-----------------+
| ReplicaId | BackendId | Version | VersionHash | LstSuccessVersion | LstSuccessVersionHash | LstFailedVersion | LstFailedVersionHash | LstFailedTime | SchemaHash | DataSize | RowCount | State | IsBad | IsSetBadForce | VersionCount | PathHash | MetaUrl | CompactionStatus |
±----------±----------±--------±------------±------------------±----------------------±-----------------±---------------------±--------------±-----------±----------±---------±-------±------±--------------±-------------±---------±--------±-----------------+
| 16089062 | 2858716 | 379 | 0 | 379 | 0 | -1 | 0 | NULL | -1 | 179294147 | 2248893 | NORMAL | false | false | 2 | -1 | N/A | N/A |
| 17026377 | 16979523 | 379 | 0 | 379 | 0 | -1 | 0 | NULL | -1 | 179210794 | 2248893 | NORMAL | false | false | 2 | -1 | N/A | N/A |
边Leader,再执行下
可以把挂的那两台的be.out发下吗
这样沟通太费劲了,加个微信或飞书看下?
可以语音聊下这个问题吗?
老哥我也遇到这个问题能联系下吗