Used: 438105027512, Limit: 438103947386. Mem usage has exceed the limit of single query, You can change the limit by set session variable exec_mem_limit目前我设置比较这个限制的值大,还是报错超出限制,

抱歉,我们终止,跑了将近半个小时了,还没有出来,我觉得这样跑下去没有意义,我们要做认证,如果时间太长了结果没有意义

非常抱歉,目前应该是没有更适合的方案,我们今天测试明天就终止,我觉得我们还是按照我发您第一版本建表语句,把-h 建上导入数据,加机器,如果sql5出不来我们暂且就放弃了

select l_orderkey, count(*) from lineitem group by l_orderkey order by 2 desc limit 100;
麻烦查一下这个看看是否倾斜很严重,谢谢

嗯嗯好的,我执行一下,感谢

嗯 准备数据这么久 要把原因找出来 辛苦您了

这个真无语啊,这个测试的数据集有问题

-h程序生成出来的数据就i是这个样子

整个数据就一个值,数据有问题,测试也不好使

那关于-h 的数据 生成你的是什么样的

我怀疑是不是int太短了,他比较长 写不进去异常了就变成NULL,可能要用bigint类型

先生成小量的数据测试一下,我觉得这个字段很重要的,不可能全部都是NULL,我这里看看吧。

这个生成数据第一列就是null

null是不对的 l_orderkey就是一个像是订单ID的东西 全部都是NULL 还要是分布键,如果都是NULL,那么就不可能分布了。

可以借鉴您那边生成数据程序吗?

之前我做过ssb,tpc-H我要准备一下,l_orderkey全部都是null做分布键就不合适了

那我们建表语句是不是修改会好呢

都是NULL就只有一个值,就不应该拿来做分布键了,只能用一个数据均匀的键来做

我现在导入10G数据看看,请稍等

嗯嗯好的麻烦您了,我这边也找一下其他的程序,生成一下数据,这样是不是会更好