【详述】问题详细描述
有一台be挂了
【背景】做过哪些操作?
没有操作,突然三个be都出现这类警告,有一个be挂了,看时间就是从报这个错的时间的时候挂的。
【业务影响】
【StarRocks版本】例如:1.18.2
【集群规模】例如:1fe+3be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,64核+256
【附件】
是什么原因导致的,我该怎么办,大佬们救救
be挂掉看下be.out或者dmesg -T|grep -i oom
start time: Tue Jul 19 20:13:23 CST 2022
start time: Wed Jul 20 11:27:54 CST 2022
start time: Wed Jul 20 11:31:11 CST 2022
*** Aborted at 1658553505 (unix time) try “date -d @1658553505” if you are using GNU date ***
PC: @ 0x2937a01 starrocks::vectorized::TabletScanner::close()
*** SIGSEGV (@0xa1) received by PID 25823 (TID 0x7f062c7b0700) from PID 161; stack trace: ***
@ 0x3f879d2 google::(anonymous namespace)::FailureSignalHandler()
@ 0x7f0655ddd630 (unknown)
@ 0x2937a01 starrocks::vectorized::TabletScanner::close()
@ 0x25fe5a1 starrocks::vectorized::OlapScanNode::_scanner_thread()
@ 0x1fb5c00 starrocks::PriorityThreadPool::work_thread()
@ 0x3f23007 thread_proxy
@ 0x7f0655dd5ea5 start_thread
@ 0x7f06553f096d __clone
@ 0x0 (unknown)
start time: Mon Jul 25 08:35:19 CST 2022
请问下使用的哪个版本
目前使用的是2.3.0
最新的2.3.0-rc03修复了这个问题,可以升级下


