【详述】在存算分离模式下有几个问题,没在官方文档中找到详细说明:
1、存算分离模式下,partition_live_number是否还会生效?
2、存算分离模式下,replication_num是否还会生效?从实际环境测试上来看,有的.dat文件能在不同节点上找到两份cache存储,有的却只能找到一份。
3、存算分析模式下,datacache.partition_duration控制的是热数据(也就是本地cache路径)缓存的数据时长。那么是否会同步控制HDFS里冷数据的存储时长?
4、如果datacache.partition_duration无法控制HDFS里冷数据的存储时长,如何进行控制?如何配置冷数据的老化策略?
【背景】部署存算分离模式,使用HDFS作为数据存储,建表时设置如下参数:
PROPERTIES(
“partition_live_number” = “336”,
“enable_persistent_index” = “true”,
“replication_num” = “2”,
“datacache.partition_duration” = “7 DAY”
);
【业务影响】无
【是否存算分离】是
【StarRocks版本】3.2.1
【集群规模】2fe(1 follower+1observer)+3cn(fe与cn混部)