升级到2.3.16后,其中一个be节点 磁盘占用率持续上升

【详述】升级到2.3.16后,其中一个be节点 磁盘占用率持续上升
【背景】版本升级 2.3.3 -> 2.3.16
【业务影响】
【StarRocks版本】2.3.16
【集群规模】3fe+5be
【机器信息】32C/256G/万兆
【附件】
磁盘比正常节点高出很多

be日志

tablet 1405159占用2T磁盘,如何降低磁盘

麻烦贴下show tablet 1405159的结果,并执行下最后一列DetailCmd贴下结果

上图是我执行后的结果
ADMIN SET REPLICA STATUS PROPERTIES(“tablet_id” = “1405159”, “backend_id” = “11027”, “status” = “bad”);

set bad之后已经恢复了吗?这个表是主键模型表吗

磁盘占用率还是没有恢复,但set bad之后不健康副本数为0,是主键模型

  1. 辛苦到这个be上帮找下1405159这个tablet的目录,find . -name $tablet_id /be/storage/data -R
    ,ls -lh看下大小占用
  2. 到这个be的log目录下,grep 1405159 be.INFO.log.20231116* > 1405159.log,然后帮上传下1405159.log这个文件

1405159.log (7.0 MB)

辛苦按照文件大小排序看下ls -lSh | head


这种文件大概有7w多个,所以很大,我执行set bad之后就没有文件往这个目录下写了,请问一下,这个目录下的文件是否可以删除,释放空间

set bad恢复成3副本之后可以删除,这个应该是一个已知问题,在高版本上应该修过了

确定能删除嘛?如果删除能确定,没有啥影响的话,我就准备删除了,磁盘快满了

你看下这个tablet现在三副本应该没有副本在这台机器上了?

没有了,set bad之后副本就转移到另外一台机器上了

那就可以删除,正常SR自己也会回收,只是可能还没回收掉,着急可以手动先处理下

麻烦问一下,正常回收这个时间是多久,一天嘛,有哪个参数可以调整嘛