【详述】字符串主键模型count(distinct key)很慢
【背景】查询慢
【业务影响】
【StarRocks版本】例如:2.4
【集群规模】例如:3fe(1 follower+2observer)+4be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:16C/64G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
- fe.log/beINFO/相应截图
- 慢查询:
- Profile信息
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
– bt.ods_uniqueid definition
CREATE TABLE test
(
value
varchar(64) NOT NULL COMMENT “”,
label
varchar(8) NOT NULL COMMENT “”,
uniqueId
bigint(20) NOT NULL COMMENT “”,
action
varchar(20) NULL COMMENT “”,
createdAt
datetime NULL COMMENT “”
) ENGINE=OLAP
PRIMARY KEY(value
, label
)
COMMENT “OLAP”
DISTRIBUTED BY HASH(value
, label
) BUCKETS 64
PROPERTIES (
“replication_num” = “3”,
“bloom_filter_columns” = “uniqueId”,
“in_memory” = “false”,
“storage_format” = “DEFAULT”,
“enable_persistent_index” = “false”
);
13个G的表下面的查询需要4分钟
select
label, count(distinct value)
from test
group by label;
这里主要是group by加上就慢
请问是什么问题?