2.5.21,load内存不释放

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】load类内存不释放

上图说明的是,重启导致内存释放,但是内存整体还是在上升!!

【背景】会使用flink、datax导入数据,还有insert into select导入表
【业务影响】
【是否存算分离】
【StarRocks版本】例如:2.5.21 dc2bcdb5d3
【集群规模】例如:3fe(1 follower+2observer)+6be(独立部署)
【机器信息】CPU虚拟核/内存/网卡,例如:32C/64G/万兆
【表模型】 主键模型
【导入或者导出方式】 Flink,DATAX
【联系方式】社区群8
【附件】

  • fe.log/be.INFO/相应截图
  • 完整的报错异常栈

导入的表是什么模型,有导入任务持续导入数据就会产生对应的内存使用,停掉导入任务内存释放么。另外3个fe建议使用3台follower。

所有集群都是三台flower。 导入任务没停的,但是重启SR后能释放,还有就是内存还是在缓慢上升趋势,这个有点怪异。在这个期间,导入任务没变,内存没有完全释放,还是哪个地方的内存一直在累积?

导入的表,主键模型偏多,还有就是更新模型、明细模型

专家有空帮我们看看吗? 生产环境昨晚升级内存,重启了BE,也释放了

BE内存分布情况

这个是升级之后的内存分布图

这个是体验环境,截止目前的,load内存已经上升到重启之前的范围了

这个是生产环境的,重启后,load内存就释放了

+1
3.1.11 版本也有load 内存没释放的问题

@dongquan @trueeyu 有空帮忙看看?

是不是BE有这种日志 Failed to sync segment, 如果是的话,先打个补丁吧


Aug 12, 2024 @ 15:05:14.722 segment_replicate_executor.cpp:291] Failed to sync segment SyncChannnel [host: 10.21.49.133, port: 8060, load_id: 3190ba0e-5879-11ef-9d68-0242bce55d8a, tablet_id: 405551426, txn_id: 355988230] err Internal error: no associated load channel 3190ba0e-5879-11ef-9d68-0242bce55d8a /build/starrocks/be/src/storage/segment_replicate_executor.cpp:119 _wait_response(replicate_tablet_infos, failed_tablet_infos)

Aug 12, 2024 @ 15:05:08.325 segment_replicate_executor.cpp:291] Failed to sync segment SyncChannnel [host: 10.21.51.180, port: 8060, load_id: 3190ba0e-5879-11ef-9d68-0242bce55d8a, tablet_id: 405551482, txn_id: 355988230] err Internal error: no associated load channel 3190ba0e-5879-11ef-9d68-0242bce55d8a /build/starrocks/be/src/storage/segment_replicate_executor.cpp:119 _wait_response(replicate_tablet_infos, failed_tablet_infos)

那就是这个问题,急的话,我先给你个patch,打个补丁,无风险

你用的是什么版本,2.5.21?

嗯,给个补丁,我在体验环境验证一下吧。

是的

current_version()
2.5.21 dc2bcdb5d3

你会自己打包吗

是给tag,我打包么? 可以的

https://github.com/StarRocks/starrocks/pull/49761 基于想要的Tag打上这个补丁就行