关于starrocks使用的一些困扰

【详述】问题详细描述

  1. 如果我的hive表(分区表)的分区字段是string格式的,比如date_timekey=“20230308”,我要在starrocks里面复刻一张内部表,也是以date_timekey字段做分区字段,是否可行?我看starrocks内部表创建的分区字段必须是date或datetime类型,采用insert into <starrocks_manag_table> select * from <starrcocks_hive_external_table>的方式将数据写入starrocks内部表后,会因为字段类型不符而导致date_timekey字段数据为空,有什么好的方案解决呢?

  2. 我如果要以starrick的hive外部表形式来同时访问两个hadoop集群的hive表数据,如何实现(因为在我的认知里,fe/conf下只能存在一个hadoop集群的hdfs-site和core-site)?

小弟刚接触starrocks不久,非常感谢您的耐心解答,谢谢。

您需要把字段类型改为datetime类型才行 对照类型您可以参考:

然后第二个问题 ,当前StarRocks是不支持多套访问的, 但这个可以试下配置不同的namespace ,比如 hdfs://cluster1/root/fs
hdfs://cluster2/root/fs ,dfs.nameservices可以配置多个 这样应该能访问多个HDFS集群 ,这个是个人的理解 您可以试一下 , 感谢您的提问 多多交流 共同进步 :partying_face:

非常感谢你的回答

  1. 如您的回复中,我这边需要在starrocks集群内把string字段转成datetime类型,这方面您有什么好的建议嘛?
  2. 您说的这个方案很贴切,谢谢您。但我们复制到be/conf和fe/conf下的hdfs-site和core-site中有许多配置参数,我需要把所有配置参数都配置2套嘛?还是只用配置dfs.nameservices这个配置实际上就可以了呢?