3.2.2 starrocks_be_process_mem_bytes 指标计算有问题

为了更快的定位您的问题,请提供以下信息,谢谢
【详述】问题详细描述
启动了一大批pulsar routine load 任务后,发现
starrocks_be_process_mem_bytes 指标一直在上涨,但是机器没有重启,应该不是内存泄漏

starrocks_be_bitmap_index_mem_bytes 0
starrocks_be_bloom_filter_index_mem_bytes 0
starrocks_be_chunk_allocator_mem_bytes 88090752
starrocks_be_clone_mem_bytes 0
starrocks_be_column_metadata_mem_bytes 145193366
starrocks_be_column_pool_mem_bytes 0
starrocks_be_column_zonemap_index_mem_bytes 39730790
starrocks_be_compaction_mem_bytes 0
starrocks_be_consistency_mem_bytes 0
starrocks_be_load_mem_bytes 14958738
starrocks_be_metadata_mem_bytes 1140862154
starrocks_be_ordinal_index_mem_bytes 52312432
starrocks_be_process_mem_bytes 1038908682426
starrocks_be_query_mem_bytes 0
starrocks_be_rowset_metadata_mem_bytes 592787659
starrocks_be_schema_change_mem_bytes 0
starrocks_be_segment_metadata_mem_bytes 24546442
starrocks_be_segment_zonemap_mem_bytes 21555863
starrocks_be_short_key_index_mem_bytes 25829
starrocks_be_storage_page_cache_mem_bytes 344976160
starrocks_be_tablet_metadata_mem_bytes 378334687
starrocks_be_tablet_schema_mem_bytes 155028903
starrocks_be_update_mem_bytes 484936

starrocks_be_jemalloc_active_bytes 8593088512
starrocks_be_jemalloc_allocated_bytes 7563702656
starrocks_be_jemalloc_mapped_bytes 9251643392
starrocks_be_jemalloc_metadata_bytes 965234224
starrocks_be_jemalloc_metadata_thp 0
starrocks_be_jemalloc_resident_bytes 9057812480
starrocks_be_jemalloc_retained_bytes 102875209728

starrocks be mem metrics的指标趋势图


机器内存的监控指标

【背景】做过哪些操作?

【业务影响】
starrocks_be_process_mem_bytes 超过机器内存限制后,pulsar routine load任务会报memory exceed limit 的错误
【是否存算分离】否
【StarRocks版本】例如:3.2.2
【集群规模】例如:3fe(1 follower+2observer)+20be
【机器信息】CPU虚拟核/内存/网卡,例如:64C/256G/万兆
【联系方式】社区群3-杨荣
【附件】

这个是统计的 BE 进程内存 怀疑还是有泄漏 没限制住 麻烦确认下这个系统参数的值 cat /proc/sys/vm/overcommit_memory

这个值是 1

这个环境发了一个BE 的日志给 trueeyu 大佬,有空也可以跟他沟通一下

原因基本确定了,初始化的时候,Tls的is_catched的生命周期没管理好,导致了问题。

1赞

您好,请问一下,这个问题是不是3.1.X版本也涉及。

涉及,3.1.16 Fix了这个问题,还没有发版。

好的,感谢您