3.2版本解决be节点无法正常退出问题了吗

集群配置 :3fe+4be(混部)
单台服务器配置:251g内存+48核+6块ssd盘
版本:3.0.5

生产上有个be节点所在服务器上的磁盘每隔数月就可能损坏或者无法访问(ls某块盘的话直接卡死),每次是六块盘中的其中一个损坏,不一定是哪一块盘,奇怪的是其它三台be节点上的磁盘从未损坏过,我们的运维针对服务器进行了相关升级,但是仍然会发生磁盘无法访问的情况, 不知道是sr导致的磁盘无法访问还是磁盘无法访问导致的sr上be节点处于假死状态(be进程还在并且show backends显示存活状态),整个集群已经无法truncate,尝试停止出问题的be,无法正常退出(sh stop_be.sh命令卡住很久都不动),于是采用kill强行杀掉be进程,但是杀不掉,并且be进程变成了僵尸进程,导致该be节点无法重启,只能重启操作系统消灭这个僵尸进程之后,再把这块盘从集群中拿掉才能启动该be节点。我想模拟一下某块盘损坏之后be节点是否能正常退出,但是没有合适的方法。
之前论坛里说3.2版本能解决be节点快速退出的问题,想问问现在解决了吗?

之前有人问过同样的问题如下:
image

  1. dmesg 里面看下磁盘损坏的信息。
  2. 正常be如果没有修改过配置,磁盘坏掉会导致be crash 启动不起来
  3. be停止会慢但是不会卡死
  4. be 是僵尸进程时有查看top结果么?