【详述】spill开窗计算数据分区计算错误
【背景】排查数据问题过程中发现使用spill计算开窗逻辑时存在着问题,奇怪的是如果筛选的数据少了不会有这个问题,可能还跟具体数据量有关
使用o_id进行分区 varchar类型的数字 强制spill的情况下会有计算问题
使用base64编码后的o_id可以正常分区
【业务影响】
【是否存算分离】存算一体
【StarRocks版本】3.3.17
【集群规模】1fe 1be
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【表模型】例如:主键模型
【导入或者导出方式】例如:Flink
【联系方式】
【附件】
异常的sql信息
Untitled-14 (9.2 KB)
异常的profile
8fe9bba1-8f84-11f0-a81b-02422df7d740profile.txt (188.8 KB)
后面的开窗没有sort,前面的join+spill把顺序打乱了,为啥这里会消除掉这个sort
partition by的key确实是同一个
starrocks可以实现一个sortMergeJoin吗
估计要4.1了
应该是个bug.