be_tablets 聚合的表大小和行数与 tables有较大差异，4000多张表中大概有400多张表是不一样的，有时候be_tablets 查询的表大小和行数都为0，但是tables不是，

lihao · 2026年03月18日 05:48

为了更快的定位您的问题，请提供以下信息，谢谢
【详述】通过如下sql `
– 计算每个分区的总数据量
WITH partitiondata AS (
SELECT
pm.db_name, – 数据库名称
pm.table_name, – 表名称
pm.partition_name, – 分区名称
pm.replication_num, COALESCE(SUM(tbt.data_size), COALESCE(SUM(tbt.index_disk), COALESCE(SUM(tbt.num_row), COALESCE(SUM(tbt.num_segment), COUNT(tbt.tablet_id) CASE
WHEN pm.table_name ELSE 1 END AS is_partitioned, CASE
WHEN pm.partition_name ELSE 0 END AS is_shadow_partition FROM
information_schema.partitions_meta LEFT JOIN
information_schema.be_tablets tbt
ON pm.partition_id GROUP BY
pm.db_name,
pm.table_name,
pm.partition_name,
pm.replication_num ),
tablestats AS ( SELECT
pd.db_name,
pd.table_name,
SUM(pd.tablet_count) SUM(pd.partition_num_row) SUM(pd.partition_data_size) SUM(pd.partition_index_disk) SUM(pd.partition_num_segment) SUM(pd.is_shadow_partition) MAX(pd.partition_data_size) COUNT(DISTINCT pd.partition_name) tc.distribute_bucket pd.replication_num, pd.is_partitioned FROM
partitiondata pd
JOIN
information_schema.tables_config tc
ON pd.db_name = tc.table_schema
AND pd.table_name = tc.table_name
GROUP BY
pd.db_name,
pd.table_name,
tc.distribute_bucket,
pd.replication_num,
pd.is_partitioned
)
SELECT
ts.db_name, ts.table_name, %s ts.tablet_count, ts.total_num_row, ts.total_index_disk, ts.total_num_segment, ts.total_data_size, ts.partition_count, ts.replication_num, ts.total_num_shadow_partition, tbs.table_catalog, tbs.table_type, tbs.table_rows, tbs.data_length tbs.create_time tbs.update_time CASE
WHEN ts.partition_count ELSE NULL
END ts.buckets, ts.is_partitioned FROM
tablestats ts
LEFT JOIN
information_schema.tables tbs
ON ts.db_name = tbs.table_schema
AND ts.table_name = tbs.table_name
ORDER BY
ts.tablet_count DESC; 查询表的信息，发现问题就是 be_tablets 聚合的表大小和行数与 tables有较大差异，4000多张表中大概有400多张表是不一样的，有时候be_tablets 查询的表大小和行数都为0，但是tables不是，通过 show partitions 和show tablet 查询发现有分区大小不为0，有tablet大小不为0，感觉be_tablets 那边数据会慢，对吗？
– 分区副本数 – 一般情况下每个表的副本数是相同的
0) AS partition_data_size, – 分区大小(多副本)
0) AS partition_index_disk, – 分区索引大小(多副本)
0) AS partition_num_row, – 分区数据量条数(多副本)
0) AS partition_num_segment, – 分区 segment 数(多副本)
AS tablet_count, – 统计分区的tablet 数量(多副本)
= pm.partition_name THEN 0 – 如果分区名称等于表名称，则不是分区表
– 否则是分区表
– 是否是分区表
= ‘$shadow_automatic_partition’ THEN 1 – 如果有这个分区，需要在最后给处理一下
– 否则不是shadow分区
– 是否是shadow分区
pm
= tbt.partition_id
– 一般情况下每个表的副本数是相同的
– 计算每个表的总数据量、tablet 数量、最大分区容量和分桶数
AS tablet_count, – 表的 tablet 数量（多副本）
AS total_num_row, --表总条数（多副本）
AS total_data_size, – 表总数据量 – 可以后面加一个平均每个 tablet 的数据量
AS total_index_disk, – 表总索引大小（多副本）
AS total_num_segment, – 表总 segment 数（多副本）
AS total_num_shadow_partition, – 表总shadow分区数（多副本）
AS max_partition_size, – 最大分区容量
AS partition_count, – 分区数量
AS buckets, – 分桶数
– 一般情况下每个表的副本数是相同的
– 是否是分区表
– 数据库名称
– 表名称
AS write_time, – Python 传入日期字符串 CURDATE() - INTERVAL 0 DAY as write_time, – 写入时间（年月日）
– tablet 数量
– 表总条数 (多副本) 真实条数需要除以副本数
– 表总索引大小 (多副本)
– 表总 segment 数 (多副本)
– 表总数据量 (多副本，不加索引大小) 真实表大小需要加索引大小
– 分区数量
– 一般情况下每个表的副本数是相同的
– shadow分区数量
– 表目录来源 tables 表
– 表类型来源 tables 表
– 表行数来源 tables 表
AS table_data_length, – 表数据长度来源 tables 表
AS table_create_time, – 表创建时间来源 tables 表
AS table_update_time, – 表更新时间来源 tables 表
> 1 THEN ts.max_partition_size – 分区表显示最大分区容量
AS max_partition_size, – 最大分区容量
– 分桶数
– 是否是分区表

`

【业务影响】
【是否存算分离】不是存算分离
【StarRocks版本】3.2
【集群规模】3fe（1 follower+2observer）+13be（fe与be非混部）

夏天12 · 2026年03月25日 01:05

正常来说be_tablets是实时维护的，记录BE上Tablet的详细信息，而tables它仅仅是一份元数据是有更新频率的。
其实在数据写入、删除或进行 Compaction 操作时，Tablet的统计信息就已经发生了变化。而这些变化也会直接同步和聚合到be_tablets中。但是tables中会通过CBO周期性的统计采集方式进行元数据更新。所以原则上者两者是有一定延迟。

lihao · 2026年03月20日 02:59

好的，谢谢

lihao · 2026年03月24日 02:25

您好，我在检查一张表的时候，发现 tables 有表的条数和大小， show data 和show partitions 和show tablets 都有数据，并且有大小，但是通过
select * from information_schema.partitions_meta where db_name=“xxx” and table_name = “xxx”; 拿到 partitions_id 后，根据partitions_id 查询be_tablets表过滤出来是空的。查询不出来数据。

然后select count() 和 select * limit 10,都能查询该表的数据，

mysql> show tablets from ods_wsdm.jl_yq_share_2024;
±----------±----------±----------±-----------±--------±------------±------------------±----------------------±-----------------±---------------------±--------------±---------±---------±-------±------------------------±-------------±-----------------±-------------±---------±--------------------------------------------------±----------------------------------------------------------------+
| TabletId | ReplicaId | BackendId | SchemaHash | Version | VersionHash | LstSuccessVersion | LstSuccessVersionHash | LstFailedVersion | LstFailedVersionHash | LstFailedTime | DataSize | RowCount | State | LstConsistencyCheckTime | CheckVersion | CheckVersionHash | VersionCount | PathHash | MetaUrl | CompactionStatus |
±----------±----------±----------±-----------±--------±------------±------------------±----------------------±-----------------±---------------------±--------------±---------±---------±-------±------------------------±-------------±-----------------±-------------±---------±--------------------------------------------------±----------------------------------------------------------------+
| 173202703 | 173202705 | 10004 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117191 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202703 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202703 |
| 173202703 | 208513745 | 200767338 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117191 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202703 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202703 |
| 173202703 | 208522022 | 200776661 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117191 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202703 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202703 |
| 173202707 | 173202709 | 8990247 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117184 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202707 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202707 |
| 173202707 | 173202710 | 8990248 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117184 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202707 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202707 |
| 173202707 | 208516297 | 200767337 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117184 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202707 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202707 |
| 173202711 | 173202712 | 8990249 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117196 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202711 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202711 |
| 173202711 | 173202713 | 103900681 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117196 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202711 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202711 |
| 173202711 | 173202714 | 103891524 | 0 | 8 | 0 | 8 | 0 | -1 | 0 | NULL | 13.5MB | 1117196 | NORMAL | 2025-06-14 01:14:36 | 8 | 0 | 1 | -1 | http://xxxxxxxx:8040/api/meta/header/173202711 | http://xxxxxxxx:8040/api/compaction/show?tablet_id=173202711 |
±----------±----------±----------±-----------±--------±------------±------------------±----------------------±-----------------±---------------------±--------------±---------±---------±-------±------------------------±-------------±-----------------±-------------±---------±--------------------------------------------------±----------------------------------------------------------------+

mysql>

mysql> select * from information_schema.be_tablets where partition_id = “173202702”;
Empty set (0.80 sec)

mysql>

表结构如下：

| jl_yq_share_2024 | CREATE TABLE jl_yq_share_2024 (
trade_account_no varchar(50) NULL COMMENT “”,
trust_channel_account varchar(50) NULL COMMENT “”,
fund_code varchar(6) NULL COMMENT “”,
balance decimal(16, 2) NULL COMMENT “”,
compare_diff decimal(16, 2) NULL COMMENT “”,
total decimal(16, 2) NULL COMMENT “”,
available_volume decimal(16, 2) NULL COMMENT “”,
share_date varchar(8) NULL COMMENT “”,
tp_type varchar(50) NULL COMMENT “”,
gen_time datetime NULL DEFAULT CURRENT_TIMESTAMP COMMENT “数据生成时间”
) ENGINE=OLAP
DUPLICATE KEY(trade_account_no)
DISTRIBUTED BY RANDOM
PROPERTIES (
“replication_num” = “3”,
“in_memory” = “false”,
“enable_persistent_index” = “false”,
“replicated_storage” = “true”,
“compression” = “LZ4”
); |

夏天12 · 2026年03月25日 01:06

可能这不仅仅是“慢”的问题，更可能是信息同步的延迟或者BE有点异常，你可以根据当时的资源判断下，比如CPU，内存，IO这些基础指标看下当时集群是否存在压力。因为FE和BE之间的还存在一层信息同步和缓存机制，你可以参考"tablet_stat_update_interval_second"这个参数，默认是300秒。
所以说如果BE节点未能正确地向FE报告Tablet信息，那么 information_schema.be_tablets 就会不完整或为空。不排除是由于BE节点本身的问题。

lihao · 2026年03月25日 01:41

大佬，这个问题奇怪的地方在表的最后更新日期是 2025年而不是当前，同步延迟的话有点不太可能吧。
还有个疑问就是show tablet 查询不通过 be_tablets 表嘛？而是直接查询be的吗？
我还在看还有其他表是不是也有类似的问题。

夏天12 · 2026年03月25日 03:31

你可以这样理解，be_tablets是一个视图，它从BE节点收集Tablet的统计信息并聚合展示出来的
而show tablets就是一个内部命令，它直接向FE请求最新的Tablet元数据信息，FE再从其维护的元数据中获取并返回。

be_tablets 聚合的表大小和行数与 tables有较大差异，4000多张表中大概有400多张表是不一样的， 有时候be_tablets 查询的表大小和行数都为0，但是tables不是，

be_tablets 聚合的表大小和行数与 tables有较大差异，4000多张表中大概有400多张表是不一样的，有时候be_tablets 查询的表大小和行数都为0，但是tables不是，