单次查询快,并发查询慢,机器资源富裕

【详述】压测环境,单次查询100多ms,70并发查询,性能下降明显,需要1S多,但CPU、内存、磁盘IO都富裕
【是否存算分离】否
【StarRocks版本】3.3.13-0279646
【集群规模】3fe+3be(fe与be混部)
【机器信息】华为云通用计算增强型 | 12vCPUs | 48GiB | ac7.3xlarge.4,3台机器
【联系方式】StarRocks社区群MQ
【附件】

从profile上看没问题,有两个怀疑的地方

  1. 客户端到瓶颈了
  2. big_query_profile_threshold 设置的是 0

大概率是1导致的

我们也在做测试,排查客户端有没有瓶颈。
但对SR本身,同样的查询,单次很快,才100来ms,上并发后,SR机器资源有很多富裕,但查询时间慢了很多。
下面这个是单次查询的profile,用时157ms
7c778347-466a-11f0-8386-fa163eaec9d3profile.txt (115.2 KB)

QueryExecutionWallTime: 88.636ms

walltime 也不是很高,说明BE没到瓶颈,可以关注下FE的情况,例如gc,网络等

请问profile中Planner的pending代表什么时间?是FE的还是BE的耗时?
image
41232df7-48cf-11f0-a77f-fa163eaec94bprofile.txt (33.1 KB)

可能是FE的瓶颈,并发高,所有结果获取都走FE,导致FE的IO、网络瓶颈; FE数量扩下试试

看看FE的jvm监控有没有利用率持续比较高的情况

你是开了查询队列?

查了下,确实开了
image

jvm看着正常,FE和BE部署在一起,应该没网络问题。

关闭查询队列,TPS翻倍了,CPU使用率也上来了。
:+1: