都执行一次吧,每次有大量数据导入就要执行。
嗯嗯好的,那我都执行一下
PARTITION BY RANGE 一个字段就好了 不要多个
min(时间)至max(时间) 使用批量创建分区的功能 INTERVAL 1 DAY就好了
最好晚一天1998-12-02
嗯嗯好的,感谢指点,我把有时间建成分区表
ANALYZE FULL TABLE 这个执行大表挺慢额的,今天我把执行完,把tpch 分区表建一下,导入一下数据,明天一早就开始测试,然后把结果和您反馈一下
建分区表应该提前把分区都建好了,我看建分区表还挺慢
原有的表没有分区,可以添加分区吗? 尽量表设计想好吧,比较多的限制,后面修改不一定支持。
原始表没有添加分区
原始表没分区键,导入了数据,可以直接在上面添加分区吗?我这里尝试了好像不行。
我早上直接把表drop table force ,现在从新建了
因为你们测试是几百亿,文章里最大的表是6亿,不太一样。
嗯嗯,目前我们测试tpcds 和tpch 基准测试,明天出一版测试结果,我现在把tpch 重新建表直接加分区,在重新导入数据,测一下看看结果会不会好,
麻烦测试完 也把一份结果发给我们 感谢感谢!
会的,明天我们测试完后发您一份,共同的劳动成功
分区表好像建的很慢,6年的时间跨度,是不是以天为单位,一天一天的建呢,或者是我怎么看建的进度呢
就一个表结构,没有数据, 使用批量建表结构也很慢吗?