be io使用率100%如何解决?

如图所示,be的io使用率经常达到100%,影响到数据写入任务,请问该如何定位并且优化该问题?
image

1.什么类型的磁盘?
2.是导入还是查询引起?
3.是不是并行度设置太高?
4.多少个BE节点?配置如何?

  1. ssd磁盘
  2. 是导入引起的。
  3. flink写starrocks,三个并行度,应该不算太高
  4. 5be节点,每个be 32核128g,四块ssd数据盘。

关注下导入频次,适当降低导入频次,增加每次导入的数据量。应该可以缓解。另外可以看一下是不是tablet数目太多了,少创建一些tablet也可以

之前减少过一次tablet,io打满的情况有所好转,现在每个tablet已经到1-2g了,目前导入频次一般是15秒一次

查看导入的表的BUCKETS 设计是否合理吧

已经三次减少了tablet数量,现在的tablet数量是之前的1/50,还是没有明显改善

15秒一次改为30秒,60秒试试

这样就不满足业务需求了,实时性太差了

15秒一次,一次写入多少万条数据?

流量高峰期的时候十万条,低峰期几千条左右

能得出大概多少条记录 IO就100%?

echo none | sudo tee /sys/block/vdb/queue/scheduler
echo noop | sudo tee /sys/block/vdb/queue/scheduler

看下磁盘调度是否设置正常

把磁盘都设置为none吧

需要执行什么命令呢

echo none | sudo tee /sys/block/vdb/queue/scheduler
/sys/block/vdb/queue/scheduler 这个是SSD的盘。
把所有的SSD设置为none

只需要在每台be上面执行下您发的这个命令就可以了是吧

嗯,/sys/block/vdb/queue/scheduler 这个是您的SSD的盘,这个根据您实际情况修改。

image 把路径替换成我截图的这几个吗