为了更快的定位您的问题,请提供以下信息,谢谢
【详述】备份的时候 报错(相同的语句在另一个集群中可以正常执行,排除语句本身问题)
【背景】
【业务影响】
【是否存算分离】
【StarRocks版本】例如:2.1.14
【集群规模】例如:3fe+3be(fe与be混部)
【机器信息】56C 256G
【联系方式】社区16群 Nicho
【附件】
三节点FE/BE执行没有报错信息
表名换一张可以执行成功,这是啥原因
备份失败的表的表结构发一下
尴尬了,隔了一晚上又正常了,昨天一天不正常 。。。
要什么日志,加个好友我提供给你,帮忙排查下?
当时报错,提供一下fe leader的日志吧
看到报错了,talets有问题,是这个问题吗?
只有一张表有这个问题吗
是的,现在又没问题了
不单单一张,有好几张有问题,也有几张没问题
com.starrocks.common.DdlException: Failed to create repository: failed to list remote path: s3a://starrockspro/__starrocks_repository_s3_repo/__repo_info. msg: unknown error when get file status: Connection pool shut down
at com.starrocks.common.ErrorReport.reportDdlException(ErrorReport.java:86) ~[starrocks-fe.jar:?]
at com.starrocks.common.ErrorReport.reportDdlException(ErrorReport.java:81) ~[starrocks-fe.jar:?]
at com.starrocks.backup.BackupHandler.createRepository(BackupHandler.java:196) ~[starrocks-fe.jar:?]
at com.starrocks.qe.DDLStmtExecutor$StmtExecutorVisitor.lambda$visitCreateRepositoryStatement$42(DDLStmtExecutor.java:586) ~[starrocks-fe.jar:?]
at com.starrocks.common.ErrorReport.wrapWithRuntimeException(ErrorReport.java:103) ~[starrocks-fe.jar:?]
at com.starrocks.qe.DDLStmtExecutor$StmtExecutorVisitor.visitCreateRepositoryStatement(DDLStmtExecutor.java:585) ~[starrocks-fe.jar:?]
at com.starrocks.qe.DDLStmtExecutor$StmtExecutorVisitor.visitCreateRepositoryStatement(DDLStmtExecutor.java:132) ~[starrocks-fe.jar:?]
at com.starrocks.sql.ast.CreateRepositoryStmt.accept(CreateRepositoryStmt.java:55) ~[starrocks-fe.jar:?]
at com.starrocks.qe.DDLStmtExecutor.execute(DDLStmtExecutor.java:118) ~[starrocks-fe.jar:?]
at com.starrocks.qe.StmtExecutor.handleDdlStmt(StmtExecutor.java:1187) ~[starrocks-fe.jar:?]
at com.starrocks.qe.StmtExecutor.execute(StmtExecutor.java:508) ~[starrocks-fe.jar:?]
at com.starrocks.qe.ConnectProcessor.handleQuery(ConnectProcessor.java:326) ~[starrocks-fe.jar:?]
at com.starrocks.qe.ConnectProcessor.dispatch(ConnectProcessor.java:443) ~[starrocks-fe.jar:?]
at com.starrocks.qe.ConnectProcessor.processOnce(ConnectProcessor.java:710) ~[starrocks-fe.jar:?]
at com.starrocks.mysql.nio.ReadListener.lambda$handleEvent$0(ReadListener.java:55) ~[starrocks-fe.jar:?]
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) ~[?:1.8.0_131]
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) ~[?:1.8.0_131]
at java.lang.Thread.run(Thread.java:748) ~[?:1.8.0_131]
建repo的时候,也是会出现这种偶发问题,过一段时间,又正常了,这块网络通讯是那块,我写个脚本,监控下
后面重试成功的时候,有重启过fe吗?
没有,中间集群没做任务操作,
backend也没重启过
备份失败的其中一张表的表定义能发一下吗
发你了
收到了,我先尝试本地复现一下
能在这个集群的be节点里面找一下有没有S3的报错吗