StarRocks中的创建的表,如何判断选择的分桶键和数量是否合理?

新建的starrocks的明细表时,根据业务属性选择完相应的字段作为分桶键和分桶数量,在数据写入一定量后,有没有办法确认分桶键是否足够离散,分桶数量是否合适?

您好,初步定的时候建议按照官网提供的计算方式计算一下,后续可以通过该表的各个tablet数据量来判断是否产生数据倾斜,正常来说判断你的分桶键选择的是否合适就是看最终导入的数据能否均衡的分散到你的be机器上。

1赞

您说的官网提供的计算方式,应该是指《确定分桶数量》这里吧,大概思路是先通过公式 分桶数量 = BE节点数量 * CPU 核数/2,计算分桶数量,然后再结合每个分区的数据大小,计算出每个分桶的空间大小,如果过小,则调小分桶数;如果过大,则调大分桶数,是这样吗?

这个是有相关的元数据表可以查看,还是需要逐台BE查看对应的表的tablet数量?

是这样的,可以通过show tablet from teble;查看datasize列的数值

1赞