call frontend service failed, address=TNetworkAddress(=****/), port=9020), reason=invalid TType

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】异常信息如上述标题,遇到了call frontend service failed ,invalid type
【背景]. 线上同时运行6个Flink实时任务,往dwd库实时写入数据,dwd库的transaction基本上大部分时间维持在40~80个事务,会偶发上述异常报错,我看社区提供的常见Crash/BUG的帖子中有关于这个类似的问题,并己经做了fix,BUG: 248. Invalid TType,想咨询下是什么问题导致这个异常,如果不升级版本,有什么方式可以规避这个问题,目前实时稳定性有一定的影响。
【业务影响】实时任务稳定性
【是否存算分离】否
【StarRocks版本】例如:3.2.7
【集群规模】例如:3fe+10be
【机器信息】CPU虚拟核/内存/网卡,例如:48C/64G/万兆
【联系方式】

3.2.10+ 修复了这个问题。原因是连接池被污染了,可以重试

在不升级的情况下,有没有临时的解决方案规避这个问题

Flink应该会自动重试吧

可以尝试增加重试次数

Flink用的是exactly once方式,默认的sink.max-retries只针对v1版本有效,看来只能利用Flink的任务失败自动重试了


@trueeyu 请问大佬,有在2.5的小版本里修复这个问题吗,2.5.19版本也碰到了同样的问题,是离线导入碰到的。

老版本应该是不会修复的了,直接重试任务吧