多个streamload任务写入同表同分区发现耗时较久

💬 StarRocks 用户问答功能使用相关

U_1649214213899_2858 2023年05月23日 09:35 #1

【详述】多个streamload任务写入同表同分区发现耗时较久
【背景】只有704条数据，500K左右
【业务影响】
【StarRocks版本】2.3.3
【集群规模】3fe（2 follower+1observer）+6be（fe与be混部）
【机器信息】108C/500G/万兆
【联系方式】社区群1-invert或者532309747@qq.com
【附件】

LIANGCHAOHUA 2023年05月23日 09:59 #2

701条数据总耗时单位是秒吗

U_1649214213899_2858 2023年05月24日 06:17 #3

是的，耗时29s多，查be日志耗时如图

LIANGCHAOHUA 2023年05月24日 11:48 #4

如果stream load不是写入同表同分区就不慢了吗？

U_1649214213899_2858 2023年05月25日 02:17 #5

我们昨天拆表了，没有了并发，发现还是慢

红箭头的地方耗时，为什么这么大？

LIANGCHAOHUA 2023年05月25日 04:16 #6

您每批任务跑多点数据，几十万，几百万都可以的。每批操作的数据量太少了。

LIANGCHAOHUA 2023年05月25日 04:17 #7

您要看一下下面哪里最耗时

U_1649214213899_2858 2023年05月25日 05:02 #8

麻烦问下能微信聊吗，这个太慢，我们要验证秒级实时写入，不能超过2s；

U_1649214213899_2858 2023年05月25日 05:03 #9

日志后面没有了，只是看到耗时大，不清楚那个地方导致的？

LIANGCHAOHUA 2023年05月25日 05:04 #10

实时写入用flink吧

U_1649214213899_2858 2023年05月25日 05:13 #11

flink 和 streamload 区别？

LIANGCHAOHUA 2023年05月25日 05:22 #12

flink可以做到2秒内，stream load主要是用来做批量导入，不是用来做实时写入的。

U_1649214213899_2858 2023年05月25日 06:23 #13

flink直接写starrocks？现在的问题是，图中那个耗时大，应该和flink或者streamload 写入方式没关系吧？

szza 2023年05月26日 03:23 #14

你这个耗时在图中 backendId=11004 这个节点上长尾了，花了4s+，导致整个stream-load任务耗时长，你排查下这个节点磁盘io、cpu负载是不是比较大

U_1649214213899_2858 2023年05月26日 08:51 #15

这个是升级到2.5.6之后，打印出了具体的耗时，帮忙看下

LIANGCHAOHUA 2023年05月26日 10:07 #16

卡在刷盘了，是不是磁盘性能比较差，磁盘IO很高
BE参数 flush_thread_num_per_store=8 调整一下吧

U_1649214213899_2858 2023年05月26日 10:34 #17

ok ，我们试试

U_1649214213899_2858 2023年05月29日 03:08 #18

调参BE参数 flush_thread_num_per_store=12之后，又遇到如下耗时长的问题，辛苦帮忙看下，啥原因，如何解决? 多谢

U_1649214213899_2858 2023年05月29日 05:01 #19

没有发现 cpu 或io 很高
starrocks的监控

服务器监控

U_1649214213899_2858 2023年05月29日 07:44 #20

京ICP备2022026421号-1