starrocks show data命令统计不准

【详述】问题详细描述
见下方
【背景】做过哪些操作?
使用stream load方式从本地导入csv文件
【业务影响】
磁盘占用统计不准,浪费空间
【StarRocks版本】例如:2.4.3
【集群规模】例如:3fe+5be(fe与be分开部署)
【机器信息】CPU虚拟核/内存/网卡,例如:16C/64G
【联系方式】社区群15-老张
【附件】


问题描述:
通过stream load对同一张表导入了2次,同样的csv文件,结果出现RowCount和Size翻倍的问题,我理解的是唯一键模型,无论导入多次,行数和数据大小都应该不会变的,请问这是不是得2.4.3版本的一个bug?

我也试了下,unique key模式下重复插入多次统计的RowCount确实是多倍数据。 primary key模式下重复多次插入也只统计单次的数据。估计是unique key合并是异步还是什么逻辑 (其实能用PRIMARY KEY 为啥要用unique key,早期是没有PRIMARY KEY ,但是新版本都有,不太理解。。)

请问你是什么版本呢?但是我和starrocks开发沟通过,他说会合并的,但是合并应该是有条件的,我的表24小时过去了,空间还是没有释放

我最开始试用的是2.5版本,最近是3.0版本, unique key好像是查询时会合并,查询结果不会重复,只是统计的时候好像是多个版本的数据(重复数据,但是版本不同)

是的,之前的版本我没太注意,就是最近两次我查看磁盘空间统计,才发现的这个问题,但是如果以前的版本如果也有这个问题的话,那这个就确实是个问题了