为了更快的定位您的问题,请提供以下信息,谢谢
【详述】4fe节点,3be节点。数据配置为2副本模式。现在通过alter system decommission backend 踢出其中一个be节点,通过show backends 显示被踢出的be 数据量已经为0,但是节点无法下线。
【背景】3个be节点,有2个是64c 300G 配置,另一个是32c 64G配置。目前踢掉的是一个64c 300G的节点
【业务影响】 部分停机
【是否存算分离】 是
【StarRocks版本】例如:3.1.2
【集群规模】例如:4fe(3 follower)+3be(be独立部署)
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】社区群13-junior
【附件】
fe.warn.log:
W0827 07:44:12.603989 41460 runtime_filter_worker.cpp:284] brpc failed, error=RPC call is timed out, error_text=[E1008]Reached timeout=400ms @192.168.161.21:8060
W0827 07:44:13.999076 41460 runtime_filter_worker.cpp:284] brpc failed, error=RPC call is timed out, error_text=[E1008]Reached timeout=400ms @192.168.161.21:8060
W0827 07:50:45.390285 40862 fragment_context.cpp:170] [Driver] Canceled, query_id=11165086-6449-11ef-8f84-000c29e29144, instance_id=11165086-6449-11ef-8f84-000c29e29147, reason=InternalError
W0827 07:52:27.548218 40828 fragment_context.cpp:170] [Driver] Canceled, query_id=4dfa1607-6449-11ef-94d3-000c29bc2f49, instance_id=4dfa1607-6449-11ef-94d3-000c29bc2f4c, reason=InternalError
W0827 08:15:58.250092 40810 fragment_context.cpp:170] [Driver] Canceled, query_id=96d24769-644c-11ef-b383-000c29aca222, instance_id=96d24769-644c-11ef-b383-000c29aca225, reason=InternalError
W0827 08:15:59.443783 40818 fragment_context.cpp:170] [Driver] Canceled, query_id=978877f3-644c-11ef-94d3-000c29bc2f49, instance_id=978877f3-644c-11ef-94d3-000c29bc2f4c, reason=InternalError
W0827 08:16:01.720307 40861 fragment_context.cpp:170] [Driver] Canceled, query_id=98e3e955-644c-11ef-94d3-000c29bc2f49, instance_id=98e3e955-644c-11ef-94d3-000c29bc2f4c, reason=InternalError
W0827 08:16:09.668767 40843 fragment_context.cpp:170] [Driver] Canceled, query_id=9da01206-644c-11ef-b383-000c29aca222, instance_id=9da01206-644c-11ef-b383-000c29aca225, reason=InternalError