正在运行中的事务无法正常释放,状态为COMMITTED,报错信息wait for publishing partition 6753517 version 2728. self version: 3088. table 6753515

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】COMMITTED状态的事务没有办法进行释放,报错信息wait for publishing partition 6753517 version 2728. self version: 3088. table 6753515。
【背景】通过SWAP命令做了表的原子替换,当时正常,然后过了2个小时做一个BE节点的DECOMMISSION操作,DECOMMISSION结束后开始陆续出现事务堆积的情况,最终超过了1000个。
【业务影响】无法提交事务:failed to begin: current running txns on db 114062 is 1000, larger than limit 1000
【是否存算分离】否
【StarRocks版本】例如:2.5.13
【集群规模】例如:3fe(3 follower)+7be
【机器信息】64C/384G/万兆
【联系方式】社区群11-coofive

基于上面的问题,目前是通过增加配置max_running_txn_num_per_db的大小来临时解决任务写入报错,请问如何删除这些状态不正确的事务?

我找了一个事务号281349235,检索了一下fe与be的日志,希望能有一些参考logs-2024-09-10 15_07_01.json (273.4 KB)

解决没,我也是增加配置max_running_txn_num_per_db的大小来临时解决任务写入报错。

解决了,通过把这个对应的表进行数据导入到另外一张表,把这张表进行drop后,事务就会自动删除掉。