3.0.2 版本be节点宕机重启

【详述】集群中一台be无故宕机重启
【背景】查询很少,目前只有两个Flink任务实时导入
【业务影响】暂无,测试集群,测试3.0.2稳定性
【StarRocks版本】3.0.2
【集群规模】3fe + 3be(fe与be混部)
【机器信息】8C/32G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】

Flink实时写入表为Primary Key模型表,平均每分钟40万条数据,表主键有4个字段(date,bigint,bigint,string),使用的自动分桶,并开启了enable_persistent_index,此外在任务导入过程中,be节点日志中发现有 rollback transaction from engine successfully

发个完整的be.out?

be.out (24.0 KB)

你自己编译的版本?

嗯,使用官方镜像,在3.0.2版本分支编译的

发生过一次Crash,还是频繁Crash?

starrocks::ImmutableIndexMetaPB, 目前只发现一次crash

这个堆栈太奇怪了,没打全

怀疑是个内存写乱的问题,如果频繁Crash的话,可以给你打个Patch试试

没有频繁,只遇到遇到过一次。另外想问下,该版本be日志中有大量的发现有 rollback transaction from engine successfully,日志级别为info,这个是正常的吗? 为什么会rollback transaction?

先升级到3.0.3吧