主键模型 remove_expired_versions tablet 很慢,磁盘空间膨胀异常

Starrocks 3.1.1版本
1fe 3be be配置700G内存

使用主键模型初始化导入数据,从kafka routine load 导入,发现磁盘空间使用异常,膨胀很腻害。几百G的数据使用了几十T的磁盘空间,快爆盘了。

从日志中发现,大量
I0118 15:03:46.950240 59792 tablet_updates.cpp:2136] remove_expired_versions tablet:10153 #version:
的内容,看着应该是删除过期的tablet 文件。停止导入,过很长时间存储空间可以降下来到正常水平。
请教下这一块的删除逻辑是什么,为什么是通过expired_versions 来删除数据的,有没有什么方法可以加速删除,保证数据正常导入,谢谢~

建表语句请脱敏发下

CREATE TABLE table_a (
aa varchar(65533) NOT NULL COMMENT “”,
bb varchar(65533) NOT NULL COMMENT “”,
bb varchar(65533) NOT NULL COMMENT “”,
dd int(11) NULL COMMENT “”,
ee int(11) NULL COMMENT “”,
ff varchar(65533) NULL COMMENT “”,
gg varchar(65533) NULL COMMENT “”,
hh varchar(65533) NULL COMMENT “”,
ii varchar(65533) NULL COMMENT “”,
jj varchar(65533) NULL COMMENT “”,
kk float NULL COMMENT “”,
ll float NULL COMMENT “”,
mm float NULL COMMENT “”,
nn int(11) NULL COMMENT “”,
oo varchar(65533) NULL COMMENT “”,
pp int(11) NULL COMMENT “”,
qq int(11) NULL COMMENT “”,
rr int(11) NULL COMMENT “”,
ss float NULL COMMENT “”,
tt int(11) NULL COMMENT “”,
uu varchar(65533) NULL COMMENT “”,
vv float NULL COMMENT “”,
ww float NULL COMMENT “”,
xx float NULL COMMENT “”,
yy int(11) NULL COMMENT “”,
zz varchar(65533) NULL COMMENT “”,
aaa float NULL COMMENT “”,
bbb varchar(65533) NULL COMMENT “”,
ccc bigint(20) NULL COMMENT “”,
ddd varchar(65533) NULL COMMENT “”,
eee varchar(65533) NULL COMMENT “”,
fff int(11) NULL COMMENT “”,
ggg int(11) NULL COMMENT “”
) ENGINE=OLAP
PRIMARY KEY(aa,bb)
DISTRIBUTED BY HASH(bb) BUCKETS 2000
PROPERTIES (
“replication_num” = “1”,
“in_memory” = “false”,
“enable_persistent_index” = “true”,
“replicated_storage” = “true”,
“storage_medium” = “SSD”,
“compression” = “LZ4”
);

您使用的什么导入方式,导入数据的频次,导入数据量都是多,be中有添加过什么配置么?如果有请发下

使用的stream load的方式,导入速度2w/s,每批次提交1w -5w条都尝试过。
后面使用routine load的方式,也是大概2w/s的速度