建了两个视图,一个是 colocation ,一个不是 colocation ,为了对比,分区和分桶键,分桶数都是一样的,数据都是一样的,但是从查询里面看,扫描的时候明显 colocation 表要慢一些。
随便找了一个分区的 tablet 来看,发现都是均匀分布在三台机器上的,既然这样的话为什么scan 的差距这么大尼
我的猜测
-
虽然数据条数一样,但是数据大小不一样,是不是 colocation 表会有压缩数据?但是压缩数据的话数据大小差距不会这么小吧,难道多出来的数据只是存储的元数据会多点?
-
或者 colocation 表的存储组织方式是完全和 非 colocation 不一样的,为了方便本地join ,做了特殊的优化,导致损失了 scan 时候的性能?
希望有大佬帮忙答疑解惑,,感觉很有意思的问题。30a6df03-119b-11ef-b223-bedd3afadc13-profile-43.txt (72.0 KB) fe841720-119a-11ef-b223-bedd3afadc13-profile-187.txt (45.3 KB)