【BE节点异常宕机】

这个大概率是已知问题 有类似的堆栈修复 麻烦您升级到最新的2.5.13版本吧 再进行下验证

是这个问题吗?


看着这个在2.5之前已经修复了呢

有涵盖的好几个堆栈pr 升级到最新版本是合入的 也能规避一下后面已知的问题影响

是否能提供下大致是什么函数引起的吗?
目前可能不太方便升级,想通过规避使用的方式暂时阻止下be宕机

我的也遇到这个问题了,版本是2.5.2,你后来是升级解决了吗?还是怎么搞的?

发下你的be.out

我的be.out里面没什么打印输出,info里面主要这个报错
W0328 17:30:43.039203 32612 mem_hook.cpp:254] large memory alloc: 1195725857 bytes, stack:
@ 0x46fc4db malloc
@ 0x7be9bc5 operator new()
@ 0x7c6206a std::__cxx11::basic_string<>::_M_mutate()
@ 0x7c62a90 std::__cxx11::basic_string<>::_M_replace_aux()
@ 0x2b7f29d apache::thrift::protocol::TBinaryProtocolT<>::readStringBody<>()
@ 0x2b7f3ac apache::thrift::protocol::TVirtualProtocol<>::readMessageBegin_virt()
@ 0x4852ba9 apache::thrift::TDispatchProcessor::process()
@ 0x570b018 apache::thrift::server::TConnectedClient::run()
@ 0x5703514 apache::thrift::server::TThreadedServer::TConnectedClientRunner::run()
@ 0x5705d1d apache::thrift::concurrency::thread::threadMain()
@ 0x56eb486 std::thread::_State_impl<>::_M_run()
@ 0x7c64900 execute_native_thread_routine
@ 0x7f79a72f3ea5 (/usr/lib64/libpthread-2.17.so;6527c38c (deleted)+0x7ea4)
@ 0x7f79a690e9fd (/usr/lib64/libc-2.17.so;6527c38c (deleted)+0xfe9fc)
@ (nil) (unknown)

我的be.out里面没什么打印输出,info里面主要这个报错
W0328 17:30:43.039203 32612 mem_hook.cpp:254] large memory alloc: 1195725857 bytes, stack:
@ 0x46fc4db malloc
@ 0x7be9bc5 operator new()
@ 0x7c6206a std::__cxx11::basic_string<>::_M_mutate()
@ 0x7c62a90 std::__cxx11::basic_string<>::_M_replace_aux()
@ 0x2b7f29d apache::thrift::protocol::TBinaryProtocolT<>::readStringBody<>()
@ 0x2b7f3ac apache::thrift::protocol::TVirtualProtocol<>::readMessageBegin_virt()
@ 0x4852ba9 apache::thrift::TDispatchProcessor::process()
@ 0x570b018 apache::thrift::server::TConnectedClient::run()
@ 0x5703514 apache::thrift::server::TThreadedServer::TConnectedClientRunner::run()
@ 0x5705d1d apache::thrift::concurrency::thread::threadMain()
@ 0x56eb486 std::thread::_State_impl<>::_M_run()
@ 0x7c64900 execute_native_thread_routine
@ 0x7f79a72f3ea5 (/usr/lib64/libpthread-2.17.so;6527c38c (deleted)+0x7ea4)
@ 0x7f79a690e9fd (/usr/lib64/libc-2.17.so;6527c38c (deleted)+0xfe9fc)
@ (nil) (unknown)
[/quote]

这个修了啊,升级

你dmesg -T 看下是不是oom了。看下 cat /proc/sys/vm/overcommit_memory

,确实是oom呢

用了1G内存就OOM了?

/proc/sys/vm/overcommit_memory

这个改成1

这个我看了一下,现在就是1呢,我现在是2.5.2,想升级到3.1,不知道怎么样呢?

不是版本的问题,是你环境的问题,这个Java进程只用了1G,就OOM了

先升级到2.5.20看看吧

行的,我先升级2.5.20

,日志上说的是1g,但是我看监控里面都激增了

你是很多占内存的进程混部在一台机器吗?