为了更快的定位您的问题,请提供以下信息,谢谢
【详述】13:10左右starrocks集群某个be节点线程数飙升到7.5k左右,其他七个节点稳定在1k左右
重启异常be节点后恢复正常
【背景】期间有物化视图刷新,routine load 导入,但是每天都有导入和跑数任务,今天突发异常
【业务影响】线程数飙升导致那一个节点满负载,木桶效应
【是否存算分离】
【StarRocks版本】例如:3.1.17
【集群规模】例如:3fe(5 follower+1observer)+8be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
- fe.log/beINFO/相应截图
be.WARNING.txt (57.8 KB) - 慢查询:
- Profile信息,获取Profile,通过Profile分析查询瓶颈
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- pipeline是否开启:show variables like ‘%pipeline%’;
- be节点cpu和内存使用率截图
- 查询报错:
- query_dump,怎么获取query_dump文件
- be crash
- be.out
- coredump,如何获取coredump
- 外表查询报错
- be.out和fe.warn.log