抱歉,我们终止,跑了将近半个小时了,还没有出来,我觉得这样跑下去没有意义,我们要做认证,如果时间太长了结果没有意义
非常抱歉,目前应该是没有更适合的方案,我们今天测试明天就终止,我觉得我们还是按照我发您第一版本建表语句,把-h 建上导入数据,加机器,如果sql5出不来我们暂且就放弃了
select l_orderkey, count(*) from lineitem group by l_orderkey order by 2 desc limit 100;
麻烦查一下这个看看是否倾斜很严重,谢谢
嗯嗯好的,我执行一下,感谢
嗯 准备数据这么久 要把原因找出来 辛苦您了
这个真无语啊,这个测试的数据集有问题
整个数据就一个值,数据有问题,测试也不好使
那关于-h 的数据 生成你的是什么样的
我怀疑是不是int太短了,他比较长 写不进去异常了就变成NULL,可能要用bigint类型
先生成小量的数据测试一下,我觉得这个字段很重要的,不可能全部都是NULL,我这里看看吧。
这个生成数据第一列就是null
null是不对的 l_orderkey就是一个像是订单ID的东西 全部都是NULL 还要是分布键,如果都是NULL,那么就不可能分布了。
可以借鉴您那边生成数据程序吗?
之前我做过ssb,tpc-H我要准备一下,l_orderkey全部都是null做分布键就不合适了
那我们建表语句是不是修改会好呢
都是NULL就只有一个值,就不应该拿来做分布键了,只能用一个数据均匀的键来做
我现在导入10G数据看看,请稍等
嗯嗯好的麻烦您了,我这边也找一下其他的程序,生成一下数据,这样是不是会更好