StarRocks BE cpu锯齿状使用率,10分钟一次90%

【详述】StarRocks BE cpu锯齿状使用率,10分钟一次90%
【背景】集群刚建立,将旧版存算一体的迁移过来;并加入了4个bitmap相关异步物化视图和11 个rountine;还有9个库主键表每个库平均30张表,表自动分桶;之前以为分桶太多,改成自动分桶问题还存在;

【业务影响】 在CPU高时候,查询卡主了;
【是存算分离】 是
【StarRocks版本】3.3.0
【集群规模】3fe(3 follower)+3be(fe与be混部)8u 64G
【机器信息】CPU虚拟核/内存/网卡,8u/64G/万兆
【联系方式】微信 winter_1123

【附件】
fe.log

  • be.INFO/相应截图

    • 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
      image
    • pipeline是否开启:show variables like ‘%pipeline%’;
      image
    • be节点cpu和内存使用率截图
      CPU

![WeChatWorkScreenshot_d6e2d736-9eb8-4e22-9617-f4faac702748|690x315]
(upload://kFNU8YFVKb0tp8t2hCUeswQCTsz.png)

内存
image

网络

表结构
WeChatWorkScreenshot_83c737e8-afea-4704-93e5-b685a93ec51e
WeChatWorkScreenshot_a1f26e81-6e2b-4a12-ad87-9a843e9f0360

七天数据量

  • be crash
    • be.out

select *
from information_schema.partitions_meta
order by Max_CS desc;


看上面top的截图是scan线程,cpu高的时间点可以尝试抓下是哪些query id,http://be_ip:8040/mem_tracker?type=query_pool&upper_level=5

凯哥已经确定了问题了,是没有开合并文件。导致小文件过多,写入主键表的时候,大量扫文件,导致CPU暴涨

原因是迁移时候关闭了合并调度;
设置参数
ADMIN SET FRONTEND CONFIG(“lake_compaction_max_tasks”="-1");