【详述】某个主键表查询多次出现如下报错
【背景】这个表会有准实时读写
【业务影响】影响生产
【是否存算分离】否
【StarRocks版本】3.2.6
【集群规模】例如:3fe(3 follower)+3be(fe与be分开部)
【机器信息】CPU虚拟核/内存/网卡,例如:16C/64G/万兆
【联系方式】社区群19-沐
【附件】
如下为查询报错,接连出现多次,重启查询对应的fe节点后正常,然后几个小时后又再次出现
ERROR 1064 (HY000): get_applied_rowsets(version 1305122) failed tablet:1118154 #version:322 [1305253 1305559@321 1305559] #pending:0 cost (0/0/0) backend [id=11001] [host=10.14.2.37]
通过异常后执行如下,结果显示正常
show tablet 1118154;
得到DetailCmd后在执行如下,结果显示正常
SHOW PROC ‘/dbs/11390/56947/partitions/56946/1118153/1118154’;
结果为:
得到CompactionStatus后网页获取得到如下文档
be39.txt (7.6 KB) be37.txt (6.1 KB) be38.txt (7.7 KB)
重启fe后正常的CompactionStatus文档如下
be39normal.txt (1.6 KB) be37normal.txt (1.6 KB) be38normal.txt (1.6 KB)
补充说明: 我发现这个异常是fe级别的,即我在34fe节点查询某个表正常,但是我在35fe节点同样查询,就报这个错了,但是35节点也不是所有sql都报错,只有部分的报错