Used: 438105027512, Limit: 438103947386. Mem usage has exceed the limit of single query, You can change the limit by set session variable exec_mem_limit目前我设置比较这个限制的值大，还是报错超出限制，

LIANGCHAOHUA · 2022年09月9日 03:47

用双引号 “|”

LIANGCHAOHUA · 2022年09月9日 03:47

清表用drop table xxx force;

U_1661311713302_9922 · 2022年09月9日 03:53

我在测试一下，按照您的建议加上”“

U_1661311713302_9922 · 2022年09月9日 04:42

加上双引号还是不行，我直接按照你的方式导入吧

U_1661311713302_9922 · 2022年09月9日 06:09

数据分布键我们选择第二列或者是第三列这样也可以吧

LIANGCHAOHUA · 2022年09月9日 06:39

选择其他分布键就用不了colocate join

U_1661311713302_9922 · 2022年09月9日 07:21

现在hdfs 上的数据也没有变换，以你们以往的经验，像我这样疑难杂症有解决办法吗

LIANGCHAOHUA · 2022年09月9日 07:23

前10条没问题，后面都有问题，就只有那个字段变成null，这个有点奇怪，暂时没思路。

LIANGCHAOHUA · 2022年09月9日 07:32

原文本 cat -A 看看是不是有什么特殊字符在那个字段里

U_1661311713302_9922 · 2022年09月9日 07:38

是有$

LIANGCHAOHUA · 2022年09月9日 07:40

最后有$是正常，您是怎么导入hdfs得？

U_1661311713302_9922 · 2022年09月9日 07:42

hdfs dfs -put 直接put 上去

LIANGCHAOHUA · 2022年09月9日 07:43

是每个文件前10行都是正常后面都不正常吗？

LIANGCHAOHUA · 2022年09月9日 07:44

是不是导入的数据超过int的限制了，把字段改为bigint

LIANGCHAOHUA · 2022年09月9日 07:45

把那些分布键改为bigint，然后对应colocate join的键也要改为bigint

U_1661311713302_9922 · 2022年09月9日 07:46

我看后几行也正常的

LIANGCHAOHUA · 2022年09月9日 07:47

把那个改为bigint，然后导入一个文件试试

U_1661311713302_9922 · 2022年09月9日 08:19

我在导入呢，稍等导入完试试

LIANGCHAOHUA · 2022年09月9日 08:58

导入一个文件后成功吗？

U_1661311713302_9922 · 2022年09月9日 10:08

现在可以了看上去，就是int 修改成才bigint，数据分布列重复值越少性能越好吧