为了更快的定位您的问题,请提供以下信息,谢谢
【详述】
StarRocks分组的一个BUG,用同一个SQL每次查询的结果不一致
建表语句:
CREATE TABLE t_item_archives
(
shop_admin_id
bigint(20) NOT NULL COMMENT “商户ID”,
barcode_id
bigint(20) NOT NULL COMMENT “条码ID”,
item_id
bigint(20) NOT NULL COMMENT “商品ID”,
item_pack_id
bigint(20) NOT NULL COMMENT “包装ID”,
code
varchar(65533) NOT NULL COMMENT “商品编码”,
name
varchar(65533) NOT NULL COMMENT “商品名称”,
barcode
varchar(65533) NOT NULL COMMENT “国际条码”,
operation_time
datetime NOT NULL COMMENT “操作时间”
) ENGINE=OLAP
PRIMARY KEY(shop_admin_id
, barcode_id
)
COMMENT “OLAP”
DISTRIBUTED BY HASH(shop_admin_id
) BUCKETS 32
ORDER BY(shop_admin_id
, item_id
)
PROPERTIES (
“replication_num” = “1”,
“datacache.enable” = “true”,
“storage_volume” = “builtin_storage_volume”,
“enable_async_write_back” = “false”,
“enable_persistent_index” = “true”,
“persistent_index_type” = “LOCAL”,
“compression” = “LZ4”
);
执行语句:
SELECT COUNT(1) FROM (SELECT shop_admin_id, COUNT(1) cnt FROM t_item_archives GROUP BY shop_admin_id) t
执行结果:
发现这个语句 虽然对shop_admin_id分组了,但是结果里面还是有重复的shop_admin_id SELECT shop_admin_id,count(1) cnt FROM t_item_archives GROUP BY shop_admin_id
【背景】做过哪些操作?
【业务影响】
【是否存算分离】是存算分离
【StarRocks版本】3.2.8
【集群规模】3fe(3 follower)+3be(fe与be混部)
【机器信息】CPU虚拟核/内存/网卡,例如:8C/32G/万兆
【联系方式】为了在解决问题过程中能及时联系到您获取一些日志信息,请补充下您的联系方式,例如:社区群4-小李或者邮箱,谢谢
【附件】
- fe.log/beINFO/相应截图
- 慢查询:
- Profile信息,获取Profile,通过Profile分析查询瓶颈
- 并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
- pipeline是否开启:show variables like ‘%pipeline%’;
- be节点cpu和内存使用率截图
- 查询报错:
- query_dump,怎么获取query_dump文件
- be crash
- be.out
- coredump,如何获取coredump
- 外表查询报错
- be.out和fe.warn.log