为了更快的定位您的问题,请提供以下信息,谢谢
【详述】BE服务节点,从3节点,新增扩容至6节点。出现部分表clone异常。
【背景】新增BE服务节点。
【业务影响】
【是否存算分离】
【StarRocks版本】2.5.10
【集群规模】例如:3fe(1 follower+2observer)+6be
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
新增BE节点后,部分tablet正常迁移,但是有一个id为233860561的tablet一直不断重试clone。但是一直失败。
从FE的错误日志看到。
[Daemon.run():117] daemon thread got exception. name: tablet scheduler
java.lang.IllegalStateException: 233860561
at com.google.common.base.Preconditions.checkState(Preconditions.java:512) ~[spark-dpp-1.0.0.jar:?]
at com.starrocks.catalog.TabletInvertedIndex.getReplica(TabletInvertedIndex.java:656) ~[starrocks-fe.jar:?]
at com.starrocks.clone.DiskAndTabletLoadReBalancer.isTabletExistsInBackends(DiskAndTabletLoadReBalancer.java:894) ~[starrocks-fe.jar:?]
at com.starrocks.clone.DiskAndTabletLoadReBalancer.tryToBalanceTablet(DiskAndTabletLoadReBalancer.java:1224) ~[starrocks-fe.jar:?]
是否有命令手动迁移或者取消这个tablet的clone行为。
另外,节点已经新增3天,整个集群间的tablet还是没有平稳完成,
平衡非常缓慢,甚至不执行平衡。
红线是旧节点,青线是新增的节点,两个节点之间的tablet没有持续的平衡。
执行命令:
均返回空。
是否有 命令开启强制的平衡?