【详述】报错 Commit failed. txn: %d table: %s tablet: %d quorum: %d<%d errorReplicas: %s
【背景】insert into select * from tab (3亿行,写入HDD表)同时datax insert数据(写入SSD表)
【业务影响】
【StarRocks版本】2.4.2
【集群规模】例如:1fe+4be
tablet=19691619 用show proc 查看没有bad
从源码看好像是 id为19691619 tablet的版本号小于他的commitVersion,然后标记了LastFailedVersion。导致这个报错。不知道这个理解对不对,请问具体逻辑是怎么样的?
为什么tablet会小于commitVersion?insert into 任务与datax任务写入的是不同额磁盘,应该不会有争抢挤硬盘IO的问题,难道是FE上负责写入tablet 的内存不够导致排队了?后续该如何优化?
【附件】

