为了更快的定位您的问题,请提供以下信息,谢谢
【详述】3个BE节点异常退出后,无法启动
【背景】
开发进行update全表一个字段值,导致三个BE均崩溃(进程退出)。对BE进行启动时,无法启动。
BE配置限制使用30G内存
mem_limit = 30G
以下时崩溃时,BE INFO的日志(详细查看附件)
以下是BE WARNING的日志(详细查看附件)
FE进程正常 BE启动几秒后提示killed(被内核OOM killed)
启动BE时 out日志。
启动BE前系统内存占用情况。
linux内核有be的oom信息(be限制10G 和20G 都会有oom)
BE配置
FE配置
【业务影响】影响所有涉及使用StarRocks系统(所有业务)。
【是否存算分离】否
【StarRocks版本】3.2.6
【集群规模】3fe(1 LEADER+2FOLLOWER)+3be(fe与be混部)
【机器信息】12C/38G/万兆
【联系方式】社区群17- Kay,谢谢
【附件】
- fe.log/beINFO/相应截图 上面已提供
附件过大请在群内联系 - 慢查询:
- Profile信息
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- pipeline是否开启:show variables like ‘%pipeline%’;
- be节点cpu和内存使用率截图
- 查询报错:
- query_dump,怎么获取query_dump文件
- be crash
- be.out
- coredump,如何获取coredump
- 外表查询报错
- be.out和fe.warn.log