【详述】客户端报错:
[2022-12-20 10:12:09] [42000][1064] Backend not found. Check if any backend is down or not
监控显示有be down机。但实际登录查看,进程是正常的。
【背景】从be2.0.7升级到2.2.8
【业务影响】
【StarRocks版本】2.2.8
【集群规模】3fe(1 follower+2observer)+21be
【机器信息】64C/256G/万兆
【详述】客户端报错:
[2022-12-20 10:12:09] [42000][1064] Backend not found. Check if any backend is down or not
监控显示有be down机。但实际登录查看,进程是正常的。
【背景】从be2.0.7升级到2.2.8
【业务影响】
【StarRocks版本】2.2.8
【集群规模】3fe(1 follower+2observer)+21be
【机器信息】64C/256G/万兆
已知问题已经修复,升级到对应分支最新的版本即可
你好,进入mysql shell 查询表, 有些表报错: ERROR 1064 (HY000): Backend not found. Check if any backend is down or not; 但查看各be节点状态,都是正常的。
show backends; 各节点也存活的;用健康检测端口也都是正常的;
show proc ‘backends’ 有3个节点的errmsg 显示 unknown 。
请问要怎么排查?
使用 ADMIN SHOW REPLICA STATUS FROM table; 可以看到有些tablet 的status是 dead的;
这样的状态的tablet,是可以 升级相应分支的版本 修复吗?
另外, 发现fe.out的输出时间 会提前 3分钟左右
2.4的也有此类问题
具体问题是什么,也是假死?
ERROR 1064 (HY000): Backend not found. Check if any backend is down or not. backend: [10.10.30.12 alive: true inBlacklist: false] [10.10.30.10 alive: true inBlacklist: true] [10.10.30.11 alive: true inBlacklist: false]