【详述】集群搭起来后确认所有节点状态正常,没做任何操作,在后台跑了6天突然所有BE在差不多的时间点都挂了
【背景】搭起集群后未作任何操作
【业务影响】BE运行不稳定
【StarRocks版本】2.5.3 自己编译的arm64位版 ,可通过如入链接下载编译出的arm二进制包(30天有效期)
链接:https://pan.baidu.com/s/16MxsIF-7JcK1_EEm0dWITQ
提取码:sr25
【集群规模】5fe(5 follower)+23 CN + 32 BE +32 Broker(BE与Broker混部)
【机器信息】CPU:华为鲲鹏920 48C /内存: 380GB /网卡:千兆
【联系方式】社区群10-AlabLan
【附件】
- 挂掉的其中两个BE节点的日志:BE.zip (1.1 MB)
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- pipeline是否开启:show variables like ‘%pipeline%’;
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- be crash
- be. OUT ,be.INFO(BE的日志详见附件-两个BE节点的日志:BE.ZIP 文件)
- be. WARNING 概览,具体可以看附件