3.3.0版本升级到3.3.2版本, 导致数据丢失, tablet被删除

老师,这个问题能排查到原因吗?

fe.log.20241208-2.txt (3.6 MB) 这个是tablet id 删除前后的日志,一共709个,看上去3台机器的副本都被删除了

我们在3.3.5 版本重启BE的时候也碰到了这个问题,存算一体集群

你这个看着是be上面不知道啥原因tablet不可用了,你们磁盘没故障吧,或者没有物理删除过机器上面的数据吧

tablet不可用时,磁盘没故障,集群都是正常的,也没有物理删除过数据。

能否加个VX?你有空时,远程帮忙排查一下这个问题。

我们在存算一体集群下,3.3.2版本遇上这个问题,重启BE节点出现

请问你们有解决方案吗

没有,看来是真的有问题,大家都在反馈,还是要社区大佬排查并解决一下

社区群加下我

我这边问题排查到了,是一个乌龙,我这边基于k8s部署的,但是k8s中pod MountPath配置的和storage_path不一致,因此be写数据其实是写到了临时文件中,当重启pod之后,临时文件没了,也就读不到数据了,因此我这个和你这边应该不是同一个问题