【详述】be节点cpu在某一个时间点突然上去了,一直下不来,查询sql语句也没有大查询,一般情况很快下来,磁盘IO也不高,但是现在cpu是持续在40%上,通过top发现有4个pip_executor线程cpu使用率一直处于99%,不知道是什么原因导致的?
【背景】be节点cpu在某一个时间点突然上去了,一直下不来
【业务影响】
【StarRocks版本】2.4.3
【集群规模】例如:3fe+4be(fe与be分开部署)
【机器信息】16C/64G/万兆
涨上去这个时间点集群中qps有没有增加,看top是查询导致的,可以在cpu 使用增加时打下sudo perf record -F 99 -g -p $be_pid – sleep 10 看下
后来自己下去了,但是没有找到是哪个查询,因为耗时都很小,怎么会持续好几个小时呢?我们没有这么大的查询,最大的也就几十秒的查询
您提供下sudo perf top 看下
现在看不到了,当时没有执行这个命令
这个一般是有个大查询,Cancel不掉,或是执行时间长导致,下次pstack打个堆栈或是perf top 看下,也有可能是已修复问题,2.4版本是个过渡版本,尽快升到2.5吧