StarRocks-be突然宕掉

starrocks版本:2.1.11
集群规模:3fe 6be
be资源规格:32c 128G
描述:starrocks在半夜运行过程中,be突然宕机,经观察,cpu与内存以及磁盘均正常,因此我只能将异常日志截图出来看能不能定位一下。
如图所示,问题的发生点在晚上的4点16分左右。
be.out:


麻烦把be.out 4:16前面的堆栈发下看看


这里报错是unknown,看不出来什么有用的信息,这个是偶然性的问题还是可以复现的,可以打开一台be机器的core生成,下次有宕机时生成core文件,可以很快定位到问题,另外2.1.11的版本有点老了,可以尝试升级到比较新的版本,版本迭代修复了很多稳定性问题

最新都稳定跑3个月了,这个问题是今天凌晨发生的,因此不能复现。我去看下怎么配置be的core生成。另外本身生产一直有10分钟级别的任务调度,升级需要重启,不敢乱动怕影响线上稳定性。

了解,那可以先打开一个be的core生产。 ulimit -c unlimited 如果有core文件生成的话,可以贴在附件里,我们会第一时间处理稳定性的问题