为了更快的定位您的问题,请提供以下信息,谢谢
【详述】高频次删除表时所有修改操作很慢可以到几十秒,有一个pipline线程一直100%cpu
【背景】
六个线程每次删除一个表15天的数据,里面包含每天的几个delete操作,基本每个表删除操作100次左右,出现集群cpu上不去,修改和insert操作非常慢,几十秒到一两百秒。对一个70万数据做月级别的删除总次数差不多几十次也能重现,全部集群重启可以解决。
使用的是insert into xxx values() 5000条一次曹组欧。
【业务影响】
所有统计数据入库和原始数据入库,先删除再插入的业务周期拉长几倍,影响每日上午数据查询。
个人怀疑是有锁等待,然后能够超时释放,导致虽然慢,但是能使用,似乎是个全局锁,
对单表删除操作我已经压缩到每次10几次,还是能复现。希望排查下。
【是否存算分离】
存算一体
【StarRocks版本】例如:3.3.3和3.3.5
【集群规模】例如:3fe(1 follower+2observer)+3be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:8C/16G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
- fe.log/beINFO/相应截图
- 慢查询:
-
Profile信息
-
并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
parallel_fragment_exec_instance_num 1 -
pipeline是否开启:show variables like ‘%pipeline%’;
|enable_pipeline_engine|true|
|—|---|
|enable_pipeline_level_multi_partitioned_rf|false|
|max_pipeline_dop|64|
|pipeline_dop|0|
|pipeline_profile_level|1|
|pipeline_sink_dop|0| -
be节点cpu和内存使用率截图
-
- 查询报错:
没有报错,就是部分超时