Commit failed. txn: %d table: %s tablet: %d quorum: %d<%d errorReplicas: %s

【详述】报错 Commit failed. txn: %d table: %s tablet: %d quorum: %d<%d errorReplicas: %s
【背景】insert into select * from tab (3亿行,写入HDD表)同时datax insert数据(写入SSD表)
【业务影响】
【StarRocks版本】2.4.2
【集群规模】例如:1fe+4be

tablet=19691619 用show proc 查看没有bad

从源码看好像是 id为19691619 tablet的版本号小于他的commitVersion,然后标记了LastFailedVersion。导致这个报错。不知道这个理解对不对,请问具体逻辑是怎么样的?

为什么tablet会小于commitVersion?insert into 任务与datax任务写入的是不同额磁盘,应该不会有争抢挤硬盘IO的问题,难道是FE上负责写入tablet 的内存不够导致排队了?后续该如何优化?

【附件】

insert into select * from tab 可以通过分区的方式,减少每次的导入量。
导入时看一下FE和BE的CPU情况,负载过高了吧。