背景:
明细表 对其中一个字段做精确去重,
该字段是为string类型的,类似uuid
长度在36到88不等。数据量去重前10亿左右,去重后1亿左右 ;存在重复
问题:
使用如下两种方法查询,查询结果不一致
1.bitmap_union_count(to_bitmap(string)) 结果量不到10w ,与底表不一致
2.count(DISTINCT string) 结果量在1亿左右,与底表一致
查询时间 bitmap略块一点点
有同学遇到过不 这种会是啥问题呢
查这种问题的思路是啥呀 感谢