副本修复异常

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】我有一张3副本的表,我想测试副本自动修复,我把其中一个BE节点的storage_root_path/data/下的目录全部删除了。但是starrocks没有自动修复重建这些目录。
【背景】我把其中一个BE节点的storage_root_path/data/下的目录全部删除
【业务影响】测试环境,无
【是否存算分离】否
【StarRocks版本】3.3.19
【集群规模】3fe+3be(6台机器)
【机器信息】8C32G
【联系方式】jamesjang427@gmail.com
【附件】
问题be节点的日志一直重复报错:
W20251216 13:36:19.072564 139964666136320 stack_util.cpp:353] 2025-12-16 13:36:19.072534, query_id=00000000-0000-0000-0000-000000000000, fragment_instance_id=00000000-0000-0000-0000-000000000000 throws exception: std::filesystem::__cxx11::filesystem_error, trace:
@ 0x36fa5d0 __wrap___cxa_throw
@ 0x330dd27 std::filesystem::__cxx11::directory_iterator::directory_iterator(std::filesystem::__cxx11::path const&, std::filesystem::directory_options, std::error_code*) [clone .cold]
@ 0x61e35a8 starrocks::TabletUpdates::_get_extra_file_size() const
@ 0x61e4894 starrocks::TabletUpdates::get_tablet_info_extra(starrocks::TTabletInfo*)
@ 0x618e7e1 starrocks::TabletManager::report_all_tablets_info(std::map<long, starrocks::TTablet, std::less, std::allocator<std::pair<long const, starrocks::TTablet> > >)
@ 0x3f85835 starrocks::ReportOlapTableTaskWorkerPool::_worker_thread_callback(void
)
@ 0xc480740 execute_native_thread_routine
@ 0x7f4cea26fea5 start_thread
@ 0x7f4ce967096d __clone

be貌似已经检测到文件损坏,但是没有上报给FE
SHOW PROC ‘/cluster_balance/history_tablets’;
查询修复任务状态全是取消。


SHOW PROC '/statistic/查看,不健康副本也是空的。

有点唬哦,直接暴力删除底层数据文件 :joy:
你应该先试试admin set bad

warn日志只是有filesystem error 异常被catch后hook打印了异常栈.

这种绕过SR, 直接把底层文件删除, 跟把盘弄坏还不太一样. 可以加一些简单的防御措施, 但并不能穷尽各种异常状况.