FE异常挂掉

版本2.5.1
3台FE:36,37,38机器
服务正常启动后没有进行任何读写操作,36的FE自己挂了


然后38就开始WARN,一直WARN


几个小时后也挂掉

38挂掉差不多同一时间,37报错如下

最终37没挂,但只剩这一个FE了,也没法对外服务了。
这个问题出现了若干次了,都是没有进行任何操作FE就自己挂,重启FE可以暂时正常运行,但是过1-2天又挂,/starRocks-2.5.1/fe/meta/bdb Latch timeout,貌似一直是这个问题引起的,麻烦大佬们看一下怎么解决,现在的状况根本没法用。

你的磁盘是sata盘吗

私有云分配的虚机,都是机械盘

经排查发现有几个FE和BE是用root用户启动的(正常应该用Operator02用户),部分文件的权限变成了root:root,对所有文件重新赋权Operator02:Operator02,用Operator02重启后正常,但不确定是否是这个原因引起的问题

测试一下你的磁盘性能,感觉磁盘的性能不太行。