【详述】Starrocks3.3.7升级后cpu占用升高
【背景】
Starrocks从3.3.2升级到3.3.7后,3个be节点中的2个陆续开始出现cpu的持续升高,pidstat结果显示,pip_scan_com 线程的 %system 占比开始升高
同时fe节点开始提示这个报错 Failed to update base compaction forbidden time ranges for TABLE org.quartz.ObjectAlreadyExistsException: Unable to store Job : 'defaultGroup.scheduleSyncJob', because one already exists with this identification.
看了下代码,貌似 CompactionControlScheduler.java 代码中,重复调用了 startScheduler ,且 schedulerStarted 未被正确标记为 true
【业务影响】怀疑导致cpu 占用率提升
【是否存算分离】否
【StarRocks版本】3.3.7
【集群规模】3fe(1 leader+2follower)+3be(fe与be单独部署)
【机器信息】CPU虚拟核/内存/网卡,例如:16C/48G/万兆
【联系方式】 社区群23-Narcss
【附件】
-
pidstat 对比
-
fe.log截图