在创建一个表结构的时候,经常BUCKETS不知道要填多少个桶才感觉会比较合理,比如3台fe,4台be这样子
如果没有分区的话,而且不知道多少合适的话就BE的数量x3就可以
如果是表比较小几万行的那种,一个桶就行
,您好,如果加上有分区的话,是不是就要BE的数量×3×分区,每一个分区最好保持在多少数据量之间,20-50G这样够吗
如果是动态分区,可以使用我们的自动分桶功能。不需要填
动态分区是默认2*count(be),这个不是根据数据量来算的
最佳实践的话是怎么样的,举个例子,partition 10G ,7BE这种?
如果存在分区,每个分区数据量如果10G,那么可以将bucket设为10~15个,确保每个tablet的大小控制在500M~1G左右,避免tablet数量过多或者每个tablet大小过大
想到一个问题,SR的最小单位是tablet,那桶跟 tablet是个啥关系?
桶==tablet?
好像也能这么理解,不过我也不清楚哈哈
如果是1buckets=多个tablte,那么其实buckets就没必要限制吧,官方文档上看这个图,默认动态分区bukets是be*2,按500M单条1K,那也接近50W行,(7BE)14个tablet,单分区,最优700W?
@许秀不许秀 是不是这么理解的?