(2.4.1版本) 创建ROUTINE LOAD任务报错:ERROR 1064 (HY000): failed to send proxy request to TNetworkAddress

【详述】
创建 ROUTINE LOAD任务时报错:
ERROR 1064 (HY000): failed to send proxy request to TNetworkAddress(hostname:192.168.3.31, port:8060) err A error occurred: errorCode=62 errorMessage:method request time out, please check ‘onceTalkTimeout’ property. current value is:10000(MILLISECONDS) correlationId:1656 timeout with bound channel =>[id: 0x212168ec, L:/192.168.3.32:39416 - R:/192.168.3.31:8060]

通过telnet 和 查看后端节点状态,后端be节点都是正常的,fe、be日志也没有报错信息。

在创建任务之前,be节点一直有以下报错,不知道是不是因为这个问题导致的:
W1121 09:00:09.198859 12204 tablet_manager.cpp:892] Fail to remove or move /starrocks/storage1/data/70/117256 :Internal error: get_applied_rowsets failed, tablet updates is in error state: tablet:117256 _apply_rowset_commit error: get_latest_del_vec failed: Not found: no delete vector found tablet:117256 segment:253 version:9223372036854775807
/root/starrocks/be/src/storage/update_manager.cpp:218 get_del_vec_in_meta(meta, tsid, (9223372036854775807L), pdelvec->get(), &latest_version) tablet:117256 #version:6 [261.1 264@3 266] pending: rowsets:11

副本状态:

【StarRocks版本】2.4.1 (是从 2.4.0 升级到 2.4.1的)

【集群规模】3fe(1 follower+2observer)+3be(fe与be混部)

【机器信息】12C/128G/千兆

【表模型】主键模型

【导入或者导出方式】:routine load


FE告警日志:
fe.war (4.1 KB)

BE告警日志:
be.war (104.7 KB)

可以试下 ADMIN SET FRONTEND CONFIG (“enable_routine_load_lag_metrics”=“false”) 修改该参数,然后重试下看下。

设置了参数,还是不行。

咱们kafka是0.8.x以上的版本么?

是的,感觉不是kafka 的问题,因为未升级到2.4.1版本之前 是没问题的, 升级以后才出现的问题。

show proc ‘/statistic’;
看下有没有unhealthytablet

没有,最上面有 截图,可以参考下。

重装2.4.1版本,已解决该问题。