【详述】执行SQL偶发报Fail to open fragment,用户通过接口访问公司的数据服务,数据服务通过HikariCP连接SR集群。
【背景】无
【业务影响】影响用户查询数据
【是否存算分离】否
【StarRocks版本】V2.5.20
【集群规模】5fe(3 follower+2observer)+5be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,104C/512G/万兆
【联系方式】StarRocks社区群9-微笑人生
【查询报错】
预格式化文本将缩进 4 格
2024-05-27 11:28:57,562 WARN (thrift-server-pool-868261|1128667) [Coordinator.updateFragmentExecStatus():2527] exec state report failed status=errorCode CORRUPTION Internal error. Detail: deserialize chunk data failed. column slot id: 663, column row count: 2331, expected row count: 1166. There is probably a bug here., query_id=405992ed-1bd9-11ef-bd31-e84dd0c6d296, instance_id=405992ed-1bd9-11ef-bd31-e84dd0c6d29e
【audit日志】
预格式化文本将缩进 4 格
[root@xxx log]# cat fe.audit.log | grep 405992ed-1bd9-11ef-bd31-e84dd0c6d296
2024-05-27 11:28:57,568 [query] |Client=192.168.235.101:37798|User=data_asset_pre|AuthorizedUser=‘data_asset_pre’@’%’|ResourceGroup=default_wg|Catalog=default_catalog|Db=ads_ka|State=ERR|ErrorCode=CORRUPTION|Time=244|ScanBytes=0|ScanRows=0|ReturnRows=0|StmtId=6928475|QueryId=405992ed-1bd9-11ef-bd31-e84dd0c6d296|IsQuery=true|feIp=192.168.235.104|Stmt=with base_data … order by rn limit 5000|Digest=|PlanCpuCost=1.2927610713125005E7|PlanMemCost=5619967.7546875|IsForwardToLeader=false
【be日志】
405992ed-1bd9-11ef-bd31-e84dd0c6d29e.log (186.3 KB)
be未发生重启
【建表SQL】
建表SQL.txt (1.6 KB)
【查询SQL】
执行报错的SQL.txt (8.4 KB)
【Explain SQL】
explain_sql.txt (31.4 KB)
【DUMP SQL】
dump_file (17.8 KB)