【详述】主键模型数据有重复
【背景】做过哪些操作?
【业务影响】
【StarRocks版本】3.0.0
【集群规模】例如:3fe(1 follower+2observer)+3be(fe与be混部)
主键模型,在使用datax导入数据后发现数据有重复
PRIMARY KEY(orderid,paid_time_date,product_id)
使用orderid+product_id查询时能查出三条数据
使用完整pk查询时只有一条数据
请大佬指教
【详述】主键模型数据有重复
【背景】做过哪些操作?
【业务影响】
【StarRocks版本】3.0.0
【集群规模】例如:3fe(1 follower+2observer)+3be(fe与be混部)
主键模型,在使用datax导入数据后发现数据有重复
PRIMARY KEY(orderid,paid_time_date,product_id)
使用orderid+product_id查询时能查出三条数据
使用完整pk查询时只有一条数据
请大佬指教
建表语句请您发下完整版,我这边尝试复现下
CREATE TABLE cdouyin_order_pay (
orderid varchar(500) NOT NULL COMMENT “”,
paid_time_date datetime NOT NULL COMMENT “”,
product_id varchar(200) not NULL COMMENT “”,
channel_talent_id varchar(200) NOT NULL COMMENT “”,
productid varchar(500) NULL COMMENT “”,
institution_id bigint(20) NULL COMMENT “”,
matched_by int(11) NULL COMMENT “”
) ENGINE=OLAP
PRIMARY KEY(orderid,paid_time_date,product_id)
PARTITION BY date_trunc(‘day’, paid_time_date)
DISTRIBUTED BY HASH(product_id) BUCKETS 36
PROPERTIES(
“replication_num” = “3”,
“enable_persistent_index” = “true”
);