3.2.8升级到3.2.16,内存使用异常

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】从3.2.8升级到3.2.16,同样的sql 语句对内存的消耗呈倍数级差异。在3.2.8上执行,10个be的平均内存使用在50G;在3.2.16上执行10个be的平均内存超过200G。
【背景】从3.2.8升级到3.2.16
【业务影响】升级后内存消耗过大,导致很多sql执行失败。
【是否存算分离】否
【StarRocks版本】3.2.16
【集群规模】例如:3fe(2 follower+1leader)+10be
【机器信息】CPU虚拟核/内存/网卡,例如:112C/256G/万兆
【联系方式】1049964311@qq.com
【附件】附近有2个版本分别执行的profile和dump文件。dump_file_3.2.16.txt (103.0 KB) dump_file-3.2.8.txt (113.4 KB) profile-3.2.8.txt (153.8 KB) profile-3.2.16.txt (93.4 KB)

这里3.2.16版本问题可能出在这里,

UniqueMetrics:
   - DistributionMode: BROADCAST
   - JoinType: INNER_JOIN

CBO在这里用了BROADCAST,dwd_settlement_order_fact这个表并不小,散列后是TB级别的,最后内存就oom了

你可以在select语句开头加上/*+ JOIN_HINT(dwd_acquire_wide, SHUFFLE) */,让它强制走shuffle join试试看是否跟3.2.8一样。

统计信息没收集成功吗?

猜测是