Starrocks-3.1.6建表超时,创建不了表

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】问题详细描述
【背景】做过哪些操作?
【业务影响】Starrocks-3.1.6建表超时,创建不了表
【是否存算分离】否
【StarRocks版本】例如:3.1.6
【集群规模】例如:1fe +3be
【机器信息】CPU虚拟核/内存/网卡,例如:16C/64G/万兆
【联系方式】社区群17-Golden
【附件】

问题描述:
这个问题之前也出现过,然后重新部署了集群,当天是好的,第二天又出现了。集群里有创建分区表,然后使用starrcocks的sink,从kafka实时采集数据到这个分区表。不知道会不会跟这个有关系?但是现在把采集任务关了,也不行。
还有一点,在出现这个问题之前,这里做过高并发查询压测,压测线程1000,速度也很快。
然后集群负载很低,属于空载状态

再测试下创建表的时候,所有be节点打下pstack $be_pid > ip.pstack,然后重启下be再重试下建表看下是否可以。另外麻烦私发下be.INFO日志和pstack信息,辛苦压缩下。

之前有做过tablet很多的表的创建或者truncate操作吗?

查了一下,be有报错日志:


难道是因为我在建表之前rename了表名?

看下dmesg -T和/var/log/messages是否有些磁盘的错误

没有创建很多表,集群是新建的,只有11个表,truncate也没操作过
日志因为我已经重启了be,只有之前的日志了

dmesg -T没有错误信息
/var/log/messages有以下日志:

重启be能恢复吗?

重启be后恢复了。其中一台be的日志在附件
ddp4.tar.gz (1.1 MB)

您好,请问恢复之前有打pstack吗

应该是有一些大表的drop、truncate或者重建queue导致的
I0119 09:42:31.031877 163319 agent_task.cpp:151] Remove task success. type=DROP, signature=20506, task_count_in_queue=1705

没打开,重启了be就好了

嗯嗯,有可能的,我删了2个千万级别的表,然后其中一个表是分区表,可能和这个有关系

2.5版本也偶发这个问题,大部分是建主键表要十来分钟(3个副本,10个分桶)