参照社区性能测试步骤 ,进行了小规模TPC-DS 性能测试,对部分测试用例跑出的结果存在疑问,分析了profile后,发现某个测试用例整体耗时12s644ms而QueryCumulativeNetworkTime为19s495ms,不知是否有问题。
【是否存算分离】否
【StarRocks版本】3.1.4
【集群规模】例如:3fe(1 follower+2observer)+5be(fe与be混部)
【机器信息】32C/384G/万兆
【profile】query_04_profile.log (875.9 KB)
是正常的
profile中涉及时间相关的指标供您参考:
-
QueryExecutionWallTime:墙上执行时间 -
QueryCumulativeCpuTime:累计cpu时间 -
QueryCumulativeOperatorTime:所有算子累计执行时间,用于计算每个节点的百分比 -
QueryCumulativeScanTime:累计Scan时间 -
QueryCumulativeNetworkTime:累计网络时间 -
QueryPeakScheduleTime:所有pipeline中调度时间 -
ResultDeliverTime:Result 传输时间
关注的这个指标是累计值 我再看下profile 当前这个测试结果不符合预期吗
该测试用例在ARM架构下,明显比X86快很多。不知如何排查,具体的原因在哪里。具体对比如下:
| Query | x86 | arm | diff(arm-x86) |
|---|---|---|---|
| Q1 | 876 | 543 | -333 |
| Q2 | 938 | 493 | -445 |
| Q3 | 583 | 603 | 20 |
| Q4 | 10820 | 7503 | -3317 |
| Q5 | 1718 | 373 | -1345 |
| Q6 | 420 | 291 | -129 |
| Q7 | 822 | 538 | -284 |
| Q8 | 654 | 258 | -396 |
| Q9 | 2057 | 1924 | -133 |
| Q10 | 659 | 365 | -294 |
| Q11 | 5625 | 4992 | -633 |
| Q12 | 473 | 255 | -218 |
| Q13 | 519 | 358 | -161 |
| Q14 | 5073 | 4429 | -644 |
| Q15 | 1145 | 839 | -306 |
| Q16 | 540 | 15267 | 14727 |
| Q17 | 1318 | 3445 | 2127 |
| Q18 | 1083 | 601 | -482 |
| Q19 | 418 | 306 | -112 |
| Q20 | 423 | 363 | -60 |
| Q21 | 300 | 174 | -126 |
| Q22 | 258 | 251 | -7 |
| Q23 | 12926 | 20255 | 7329 |
| Q24 | 1386 | 1738 | 352 |
| Q25 | 1087 | 2303 | 1216 |
| Q26 | 686 | 373 | -313 |
| Q27 | 587 | 468 | -119 |
| Q28 | 1896 | 1678 | -218 |
| Q29 | 1242 | 1939 | 697 |
| Q30 | 602 | 398 | -204 |
| Q31 | 1495 | 1217 | -278 |
| Q32 | 128 | 232 | 104 |
| Q33 | 1212 | 425 | -787 |
| Q34 | 598 | 395 | -203 |
| Q35 | 965 | 923 | -42 |
| Q36 | 500 | 568 | 68 |
| Q37 | 174 | 190 | 16 |
| Q38 | 2432 | 1780 | -652 |
| Q39 | 530 | 390 | -140 |
| Q40 | 415 | 276 | -139 |
| Q41 | 133 | 91 | -42 |
| Q42 | 352 | 145 | -207 |
| Q43 | 641 | 295 | -346 |
| Q44 | 736 | 634 | -102 |
| Q45 | 680 | 436 | -244 |
| Q46 | 702 | 777 | 75 |
| Q47 | 839 | 1576 | 737 |
| Q48 | 642 | 321 | -321 |
| Q49 | 1169 | 1243 | 74 |
| Q50 | 692 | 886 | 194 |
| Q51 | 1031 | 1582 | 551 |
| Q52 | 387 | 186 | -201 |
| Q53 | 329 | 383 | 54 |
| Q54 | 2809 | 3125 | 316 |
| Q55 | 396 | 162 | -234 |
| Q56 | 970 | 377 | -593 |
| Q57 | 817 | 1089 | 272 |
| Q58 | 1721 | 571 | -1150 |
| Q59 | 1991 | 789 | -1202 |
| Q60 | 1189 | 407 | -782 |
| Q61 | 477 | 443 | -34 |
| Q62 | 440 | 493 | 53 |
| Q63 | 357 | 365 | 8 |
| Q64 | 9149 | 9863 | 714 |
| Q65 | 722 | 1537 | 815 |
| Q66 | 759 | 456 | -303 |
| Q67 | 1682 | 14337 | 12655 |
| Q68 | 587 | 353 | -234 |
| Q69 | 589 | 355 | -234 |
| Q70 | 1142 | 1124 | -18 |
| Q71 | 699 | 247 | -452 |
| Q72 | 1142 | 2932 | 1790 |
| Q73 | 505 | 295 | -210 |
| Q74 | 4577 | 3991 | -586 |
| Q75 | 2648 | 7080 | 4432 |
| Q76 | 665 | 572 | -93 |
| Q77 | 1585 | 319 | -1266 |
| Q78 | 6233 | 7540 | 1307 |
| Q79 | 960 | 960 | 0 |
| Q80 | 985 | 876 | -109 |
| Q81 | 790 | 461 | -329 |
| Q82 | 189 | 284 | 95 |
| Q83 | 1165 | 480 | -685 |
| Q84 | 322 | 336 | 14 |
| Q85 | 852 | 1106 | 254 |
| Q86 | 388 | 564 | 176 |
| Q87 | 2317 | 1823 | -494 |
| Q88 | 2625 | 3138 | 513 |
| Q89 | 443 | 408 | -35 |
| Q90 | 243 | 167 | -76 |
| Q91 | 305 | 225 | -80 |
| Q92 | 341 | 243 | -98 |
| Q93 | 558 | 1152 | 594 |
| Q94 | 736 | 650 | -86 |
| Q95 | 1674 | 1140 | -534 |
| Q96 | 273 | 285 | 12 |
| Q97 | 1628 | 2557 | 929 |
| Q98 | 442 | 440 | -2 |
| Q99 | 640 | 549 | -91 |
| Sum | 135643 | 164940 | 29297 |
- StarRocks版本:3.1.4
- 机器台数:3台:1FE+3BE
- 硬件配置:32 vCores、384GB、12*1.2TB
大佬,可以指一下arm测试脚本的路吗 我这边在官网下载的脚本执行不了
具体是哪里有报错吗?
