Used: 438105027512, Limit: 438103947386. Mem usage has exceed the limit of single query, You can change the limit by set session variable exec_mem_limit目前我设置比较这个限制的值大，还是报错超出限制，

LIANGCHAOHUA · 2022年08月27日 06:13

我是根据这个SQL改的语法不一定通过你看是否能理解

LIANGCHAOHUA · 2022年08月27日 06:13

我只改了SQL 7

U_1661311713302_9922 · 2022年08月27日 06:15

好的，如果我发现建表语句不合适的话，我删除建表语句，从新建表的话，数据是不是从新导入呢，还是说我直接建表就行了

LIANGCHAOHUA · 2022年08月27日 06:16

删除表后，数据也不存在了，我们数据库删除表是会放在trash，不是真正的删除，磁盘空间是不会释放的，请使用drop table xxx force

U_1661311713302_9922 · 2022年08月27日 06:17

LIANGCHAOHUA:

select supp_nation, cust_nation, l_year, sum(volume) as revenue
from (
select
n1.n_name as supp_nation,
n2.n_name as cust_nation,
extract(year from l_shipdate) as l_year,
l_extendedprice * (1 - l_discount) as volume
from lineitem l JOIN [broadcast] supplier s ON l.l_suppkey = s.s_suppkey
JOIN [shuffle] orders o ON l.l_orderkey = o.o_orderkey
JOIN [shuffle] customer c ON o.o_custkey = c.c_custkey
JOIN nation n1 ON s.s_nationkey = n1.n_nationkey
JOIN nation n2 ON n1.s_nationkey = n2.n_nationkey
WHERE n1.n_name = ‘FRANCE’ and n2.n_name = ‘GERMANY’ and l_shipdate between date ‘1995-01-01’ and date ‘1996-12-31’
UNION ALL
select
n1.n_name as supp_nation,
n2.n_name as cust_nation,
extract(year from l_shipdate) as l_year,
l_extendedprice * (1 - l_discount) as volume
from lineitem l JOIN [broadcast] supplier s ON l.l_suppkey = s.s_suppkey
JOIN [shuffle] orders o ON l.l_orderkey = o.o_orderkey
JOIN [shuffle] customer c ON o.o_custkey = c.c_custkey
JOIN nation n1 ON s.s_nationkey = n1.n_nationkey
JOIN nation n2 ON n1.s_nationkey = n2.n_nationkey
WHERE n1.n_name = ‘GERMANY’ and n2.n_name = ‘FRANCE’ and l_shipdate between date ‘1995-01-01’ and date ‘1996-12-31’
) as shipping
group by supp_nation, cust_nation, l_year
order by supp_nation, cust_nation, l_year;

嗯嗯好的，明白了，感谢

U_1661311713302_9922 · 2022年08月27日 09:45

LIANGCHAOHUA · 2022年08月27日 16:59

DUPLICATE KEY 建议少于等于3个KEY，DISTRIBUTED BY HASH建议少于等于2个key

U_1661311713302_9922 · 2022年08月28日 00:57

麻烦在问一下，SR 基于内存，往内存缓存数据的话，是一遍缓存一遍计算，还是需要全部缓存完之后在计算呢？

U_1661311713302_9922 · 2022年08月28日 00:57

key 越多越消耗内存吧

LIANGCHAOHUA · 2022年08月28日 06:50

一遍缓存一遍计算，子查询的结果返回的数据特别多也是占用内存的，key越多消耗的内存越多。

LIANGCHAOHUA · 2022年08月28日 06:34

DUPLICATE KEY 数据排序
PARTITION KEY 数据分区
DISTRIBUTED BY HASH 数据均匀分布

U_1661311713302_9922 · 2022年08月28日 07:40

DUPLICATE KEY 一般用前散列做缓存的话，如果前三列的数据都为null的话，是不是特别影响性能呢？像这样情况，DUPLICATE KEY 应该怎么设计呢？

bloom_filter_columns 如果用上它的话一般情况下选择几个字段，什么样的字段适合呢

LIANGCHAOHUA · 2022年08月28日 08:29

DUPLICATE KEY 尽量使用int，bigint类型。null也算一个值来处理，性能不会影响，只是某些查询可能会遗漏了null的情况，少于等于三个值。

适用场景

满足以下几个条件时可以考虑对某列建立Bloom Filter 索引：

首先BloomFilter也适用于非前缀过滤。
查询会根据该列高频过滤，而且查询条件大多是in和=。
不同于Bitmap, BloomFilter适用于高基数列。

U_1661311713302_9922 · 2022年08月28日 08:42

目前我的机器上还剩下将尽200g内存，还是报错Memory of Query5148f74a-26ac-11ed-adf2-fa163e88b465 exceed limit. Pipeline Backend: 10.0.0.83, fragment: 5148f74a-26ac-11ed-adf2-fa163e88b4f5 Used: 438104843024, Limit: 438103947386. Mem usage has exceed the limit of single query, You can change the limit by set session variable exec_mem_limit.，这种情况能通过调整参数解决吗，还是说之前的说的加be节点呢

Mem: 503 303 196 0 3 194

LIANGCHAOHUA · 2022年08月28日 09:13

请调大这个参数exec_mem_limit，
/*+ SET_VAR(exec_mem_limit = 515396075520,query_timeout=10000000,batch_size=4096,parallel_fragment_exec_instance_num=32) */

U_1661311713302_9922 · 2022年08月28日 09:16

LIANGCHAOHUA · 2022年08月28日 09:17

SELECT /*+ SET_VAR(exec_mem_limit = 515396075520,query_timeout=10000000,batch_size=4096,parallel_fragment_exec_instance_num=32) */ FROM table；
这样执行就肯定会用到

U_1661311713302_9922 · 2022年08月28日 09:18

我是这么调整
set global exec_mem_limit = 515396075520
set global parallel_fragment_exec_instance_num = 32;
set global enable_cbo = true;
Set globale batch_size=4096

LIANGCHAOHUA · 2022年08月28日 09:22

有些参数 variables 是没有的

U_1661311713302_9922 · 2022年08月28日 09:27

MySQL [information_schema]> select /*+ SET_VAR(exec_mem_limit = 515396075520,query_timeout=10000000,batch_size=4096,parallel_fragment_exec_instance_num=32) */ from session_variables;
ERROR 1064 (HY000): Syntax error in line 1:
select from session_variables
^
Encountered: FROM
Expected: FROM is keyword, maybe FROM 语句执行有问题