【详述】请求通过CLB负载均衡到FE集群,FE集群WARN日志一直会出现Connection reset by peer告警(CLB关闭健康检查,会话保持时间调整后问题依然存在)
通过抓包发现请求都是创建连接后15分钟客户端断开了连接
通过日志发现请求有从应用过来的,也有开发人员通过客户端连接的
【背景】增加CLB负载均衡到FE集群
【业务影响】客户端连接断开有影响业务
【是否存算分离】
【StarRocks版本】2.5.11
【集群规模】3FE(1 Leader + 2 Follower)+ 3BE(单独部署)
【机器信息】3FE:4C16G,3BE:16C64G
【联系方式】社区群12-Pumbaa
【附件】
- fe.log/beINFO/相应截图
- 慢查询:
- Profile信息
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- pipeline是否开启:show variables like ‘%pipeline%’;
- be节点cpu和内存使用率截图
- 查询报错:
- query_dump,怎么获取query_dump文件
- be crash
- be.out
- 外表查询报错
- be.out和fe.warn.log