数据湖查询遭遇query_mem_limit限制

U_1695179166399_6933 · 2023年12月12日 03:15

为了更快的定位您的问题，请提供以下信息，谢谢
【详述】查询一个大sql，前几次查询都可以。突然再次查询报错

设置query_mem_limit也不起作用。
【背景】查询sql:
select
tt.day,
tt.oper_name as app_id,
t1.type as app_type,
t2.id as user_id,
t2.name as user_name,
t2.company_id as company_id,
t3.name as company_name,
tt.title as api_title,
tt.oper_url as api_url,
tt.status as api_status,
count(distinct tt.oper_param) as cnt
from
(select
tt1.day,
tt1.oper_name,
tt1.oper_param,
tt2.title,
tt2.oper_url,
tt2.status
from (select distinct day,oper_name,trace_id,oper_param from hive_catalog_glue.prod_ods.cdw_user_oper_log_day where operator_type = 3 and oper_name!=’’ and day>=‘2023-11-01’ and day<‘2023-12-01’ ) tt1
inner join (select day,trace_id,title,oper_url,status from hive_catalog_glue.prod_ods.cdw_user_oper_log_day where operator_type = 4 and day>=‘2023-11-01’ and day<‘2023-12-01’) tt2 on tt1.trace_id = tt2.trace_id and tt1.day = tt2.day
)
tt
left join jdbc_rds.cdw-cloud.c_user_app t1 on tt.oper_name=t1.app_id
left join jdbc_rds.cdw-cloud.c_user t2 on t1.c_user_id=t2.id
left join jdbc_rds.cdw-cloud.c_user_company t3 on t2.company_id=t3.id
group by
tt.day,
tt.oper_name ,
t1.type,
t2.id,
t2.name,
t2.company_id,
t3.name,
tt.title,
tt.oper_url,
tt.status
【业务影响】小查询可用大查询不可用
【是否存算分离】数据湖查询
【StarRocks版本】3.1.2
【集群规模】1fe 3be
【机器信息】16core 64G
【联系方式】543503137@qq.com
【附件】

fe.log/beINFO/相应截图
查询报错：

image2558×1058 378 KB

image2550×388 45.7 KB

Liang · 2023年12月12日 06:56

请问set global配置query_mem_limit之后，有重连下会话尝试查询吗？

U_1695179166399_6933 · 2023年12月13日 06:25

试了但是我觉得不是内存的问题。因为之前查询过几次都能正常运行。而且内存已经很大了数据其实没有那么大

Liang · 2023年12月13日 09:22

奇怪的点是你配置的是42G，报错却是32G的limit

U_1695179166399_6933 · 2023年12月14日 02:10

我觉得这个不是关键关键是查询为啥被限制了 32G 42G差别不大的数据源加起来都没有32G呢

Liang · 2023年12月14日 09:55

join后的数据集很大也可能导致内存占用很多的，或者可以开启下profile，首次执行成功获取下profile我们分析下，里面会记录内存占用

许秀不许秀 · 2023年12月15日 12:46

主要是distinct占用高吧，把distinct去掉看看？

U_1695179166399_6933 · 2023年12月18日 05:59

去掉也不行

许秀不许秀 · 2023年12月18日 11:36

set enable_spill=true; set spill_mode=“force”; 跑下