执行更新操作后数据膨胀

【详述】主键表bin_trace分多批次执行update 操作后,表的体积迅速膨胀(100G+ 长到500G+),导致查询速度变慢,主键查询主键索引失效,建表语句含有bloom_filter 索引,去掉bloom_filter 索引之后表体积恢复到100G,怀疑bloom_filter 索引导致数据膨胀,去掉bloom_filter 后又再次执行数据清洗操作,大小又迅速增长到了290G,经过20+小时没有变化,显示compact 已经完成

去掉blomm_filter 之前


去掉blomm_filter 之后
594f94dde532e5ecaa84b328f0f849b

还有一张历史表bin_trace3,最近一段时间没有进行insert 和update 操作,数据量是50亿,但是大小只有90G
1720163189658

而最近操作过的bin_trace,只是多了6月的数据,数据量是53亿,大小是290G
1720163915145

所以bin_trace表的大小compact 可能存在问题,麻烦看下

【是否存算分离】否
【StarRocks版本】3.1.11
【集群规模】3fe(1 follower+2observer)+3be(fe与be混部)
【机器信息】364C/128G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
建表语句如下
建表语句.txt (1.8 KB)

等数据体积变小后,在加上bloom_filter不会有影响,是在数据更新过程中会导致数据膨胀