hive导入starRocks时怎么将当前分区清空后再进行导入

情况描述:sr分区表的分区字段create_time,已每一天作为分区,今日分区为‘p20220429’,昨天分区‘p20220428’。已通过streaming load将hive的数据同步到starRocks的分区表。

问题描述:现在hive对一周前到现在的数据重刷,hive会有start_data='2022-04-22’和end_data='20220429’两个标志;对应在sr的分区是p20220422~p20220429这七个分区。怎么在同步的过程中通过start_data和end_data先清空sr对应分区的数据,再进行数据同步?

请问下hive中的数据是按天分区的吗?如果已知哪些分区重刷需要重新写入的话,需要手动触发sql,truncate对应分区的数据,重新导入。如果要在导入过程中做这个事情,需要结合一些sql脚本实现逻辑判断和数据一致性的判断。