扩容BE节点后,BE存储空间不均衡,有两个BE空间使用率依旧高水位

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】扩容BE节点后,BE存储空间不均衡,有两个BE容量未下降,依旧保持高水位,请问数据均衡的策略是怎样的
【背景】扩容BE节点,增加了一个BE
【业务影响】无
【是否存算分离】否
【StarRocks版本】2.5.19
【集群规模】:3fe(3 follower)+13be(3个be与fe混部)
【机器信息】CPU虚拟核/内存/网卡,40C/128G/万兆
【联系方式】StarRocks社区群5 -思变 [1412195108@qq.com]
【附件】
其他节点空间有明显下降,有两个be依旧保持高水位
show backends;

show proc ‘/cluster_balance’;
±------------------±-------+
| Item | Number |
±------------------±-------+
| cluster_load_stat | 1 |
| working_slots | 13 |
| sched_stat | 1 |
| priority_repair | 0 |
| pending_tablets | 0 |
| running_tablets | 0 |
| history_tablets | 1000 |
±------------------±-------+
7 rows in set (0.00 sec)
mysql> show proc ‘/cluster_balance’;
±------------------±-------+
| Item | Number |
±------------------±-------+
| cluster_load_stat | 1 |
| working_slots | 13 |
| sched_stat | 1 |
| priority_repair | 0 |
| pending_tablets | 1511 |
| running_tablets | 8 |
| history_tablets | 1000 |
±------------------±-------+
7 rows in set (0.00 sec)

mysql> show proc ‘/cluster_balance’;
±------------------±-------+
| Item | Number |
±------------------±-------+
| cluster_load_stat | 1 |
| working_slots | 13 |
| sched_stat | 1 |
| priority_repair | 0 |
| pending_tablets | 0 |
| running_tablets | 8 |
| history_tablets | 1000 |
±------------------±-------+
7 rows in set (0.00 sec)

mysql> admin show frontend config like ‘%tablet_sched_balance_load%’;
±----------------------------------------------±-----------------------------------±------±-------±----------±--------+
| Key | AliasNames | Value | Type | IsMutable | Comment |
±----------------------------------------------±-----------------------------------±------±-------±----------±--------+
| tablet_sched_balance_load_disk_safe_threshold | [balance_load_disk_safe_threshold] | 0.5 | double | true | |
| tablet_sched_balance_load_score_threshold | [balance_load_score_threshold] | 0.1 | double | true | |
±----------------------------------------------±-----------------------------------±------±-------±----------±--------+
2 rows in set (0.00 sec)

  • 在 show proc ‘/cluster_balance/history_tablets’; 结果中,找一下 源be节点是 高水位be节点的任务,看看有没有报错信息

  • 在高水位be节点的 be.INFO 日志中搜 migrate,有没有 storage migrate failed 的日志

日志里没有搜索到migrate相关日志,

昨天我们把storage_usage_soft_limit_percent参数调整为85,现在高水位的be空间是下来了

现在我们decommission下线一个BE,有什么方式可以加快数据均衡的速度吗?
“tablet_sched_slot_num_per_path”=“8"调整为了"tablet_sched_slot_num_per_path”=“16”,速度好像也没有快起来

leader fe的fe.log频繁的在刷以下日志