StarRocks-2.5.0 Release Notes(最新版本 2.5.6,发布日期2023-05-19)

StarRocks version 2.5

2.5.0

发布日期: 2023 年 1 月 22 日

新增特性

功能优化

问题修复

修复了如下问题:

  • append_trailing_char_if_absent 函数对空值操作有误。#13762
  • 使用 RECOVER 语句恢复删除的表后,表不存在。#13921
  • SHOW CREATE MATERIALIZED VIEW 返回的结果缺少 catalog 及 database 信息。 #12833
  • waiting_stable 状态下的 schema change 任务无法取消。 #12530
  • SHOW PROC '/statistic'; 命令在 leader FE 和非 leader FE 上返回的结果不同。 #12491
  • FE 生成的执行计划缺少 partition ID,导致 BE 获取 Hive partition 数据失败。#15486
  • SHOW CREATE TABLE 返回结果中 ORDER BY 子句位置错误。#13809

行为变更

  • AWS_EC2_METADATA_DISABLED 参数默认设置为 False ,即默认获取 Amazon EC2 的元数据,用于访问 AWS resource。
  • 会话变量 is_report_success 更名为 enable_profile ,可通过 SHOW VARIABLES 语句查看。
  • 新增四个关键字: CURRENT_DATE , CURRENT_TIME , LOCALTIME , LOCALTIMESTAMP#14319
  • 表名和库名的长度限制放宽至不超过 1023 个字符。 #14929 #15020

升级注意事项

  • 可以从 2.0.x,2.1.x,2.2.x,2.3.x 或 2.4.x 升级。如需回滚版本,建议只回滚到 2.4.x。
3赞

2.5.1

发布日期: 2023 年 2 月 5 日

功能优化

  • 外表物化视图支持查询改写。 #11116#15791
  • CBO 自动全量采集支持用户设置采集时间段,防止因集中采集而导致的集群性能抖动。 #14996
  • 增加 Thrift server 队列,避免 INSERT INTO SELECT 时因为 Thrift server 中的请求过于繁忙而失败。 #14571
  • 建表时如果没有显式指定 storage_medium 属性,则系统根据 BE 节点磁盘类型自动推导并设定表的存储类型。参见CREATE TABLE 中的参数描述。#14394

问题修复

修复了如下问题:

  • SET PASSWORD 导致空指针。 #15247
  • 当 KEY 为空时无法解析 JSON 数据。 #16852
  • 非法数据类型可以成功转换至 ARRAY 类型。 #16866
  • 异常场景下 Nested Loop Join 无法中断。 #16875

行为变更

  • 取消 FE 参数 default_storage_medium ,表的存储介质改为系统自动推导。 #14394

2.5.2

发布日期: 2023 年 2 月 21 日

新增特性

功能优化

  • 优化了部分内存释放的逻辑,在查询中包含大量的聚合查询时可以显著的降低内存峰值使用。 #16913
  • 优化了排序的内存使用,对于部分带有窗口函数的查询或者是排序查询,可以减少一倍以上的内存消耗。 #16937 #17362 #17408

问题修复

修复了如下问题:

  • 无法刷新含有 MAP 或 ARRAY 数据类型的 Apache Hive 外表。#17548
  • Superset 无法识别出物化视图列类型。#17686
  • 在对接 BI 时因无法解析 SET GLOBAL/SESSION TRANSACTION 而导致的连接性问题。#17295
  • Colocate 组内的动态分区表无法修改分桶数,并返回报错信息。#17418
  • 修复了在 prepare 阶段失败可能导致的潜在问题。 #17323

行为变更

  • 新增保留关键字 CHARACTER。#17488

在哪里可以下载编译好的二进制包?官方还提供编译好的二进制包吗

2.5.3

发布日期: 2023 年 3 月 10 日

功能优化

  • 优化物化视图的查询改写:
    • 支持对 Outer Join 和 Cross Join 的查询改写。 #18629
    • 优化物化视图数据扫描逻辑,进一步加速查询。 #18629
    • 增强了单表聚合查询的改写能力。 #18629
    • 增强了 View Delta 场景的改写能力。即,查询的关联表为物化视图的关联表的子集时的改写能力。 #18800
  • 优化使用 Rank 窗口函数作为过滤条件或排序键的性能和内存占用。 #17553

问题修复

修复了如下问题:

  • ARRAY 类型空字面量导致的问题。 #18563
  • 某些复杂查询场景下,低基数字典可能被误用。增加了应用低基数字典优化前的检查来避免此类错误。 #17318
  • 在单 BE 环境下,Local Shuffle 导致 GROUP BY 包含重复结果。 #17845
  • 创建 非分区 物化视图时错误使用 分区 相关参数。增加物化视图创建检查,如果创建的是非分区物化视图,则自动禁用分区相关参数。 #18741
  • Parquet Repetition Column 的解析问题。 #17626 #17788 #18051
  • 列的 nullable 信息获取错误。在使用 CTAS 创建主键模型表时,仅将主键列设置为 non-nullable,非主键列设置为 nullable。 #16431
  • 删除主键模型表数据可能导致的问题。 #18768

https://www.mirrorship.cn/zh-CN/download/community 请在这里下载~

1赞

2.5.4

发布日期: 2023 年 4 月 4 日

功能优化

  • 优化查询规划阶段物化视图查询改写的性能,降低约 70% 的规划耗时。#19579
  • 优化类型推断,如果查询 SELECT sum(CASE WHEN XXX)FROM xxx; 中包含常量 0 ,例如 SELECT sum(CASE WHEN k1 = 1 THEN v1 ELSE 0 END) FROM test; ,则预聚合自动开启以加速查询。#19474
  • 支持使用 SHOW CREATE VIEW 查看物化视图的创建语句。#19999
  • BE 节点之间单次 bRPC 请求支持传输超过 2 GB 的数据包。#20283 #20230

问题修复

修复了如下问题:

  • 物化视图查询改写后,低基数全局字典优化不生效。#19615
  • 物化视图查询无法改写,导致查询失败。#19774
  • 基于主键模型或更新模型的表创建物化视图,物化视图查询无法改写。#19600
  • 物化视图的列名大小写敏感, 建表时 PROPERTIES 中列名大小写错误,仍然返回建表成功,未能返回报错提示,并且基于该表的物化视图查询无法改写。#19780
  • 物化视图查询改写后,执行计划中可能产生基于分区列的无效谓词,影响查询速度。#19784
  • 导入数据至新创建的分区后,物化视图查询可能无法改写。#20323
  • 创建物化视图时配置 "storage_medium" = "SSD" ,导致物化视图刷新失败。#19539 #19626
  • 主键模型的表可能会并行 Compaction。#19692
  • 大量 DELETE 操作后 Compaction 不及时。#19623
  • 如果语句的表达式中含有多个低基数列时,表达式改写可能出错,进而导致低基数全局字典优化不生效。#20161
1赞

2.5.5

发布日期:2023 年 4 月 28 日

新增特性

新增对主键模型表 tablet 状态的监控,包括:

  • FE 新增 err_state_metric 监控项。
  • SHOW PROC '/statistic/' 返回结果中新增统计列 ErrorStateTabletNum ,用于统计错误状态 (err_state) 的 Tablet 数量。
  • SHOW PROC '/statistic/<db_id>/' 返回结果中新增统计列 ErrorStateTablets ,用于展示当前数据库下处于错误状态的 Tablet ID。# 19517

更多信息,参见 SHOW PROC

功能优化

  • 优化添加多个 BE 时的磁盘均衡速度。# 19418
  • 优化 storage_medium 的推导机制。当 BE 同时使用 SSD 和 HDD 作为存储介质时,根据 storage_cooldown_time 的配置来决定默认存储类型。如果配置了 storage_cooldown_time ,StarRocks 设置 storage_mediumSSD 。如果未配置,则设置 storage_mediumHDD#18649
  • 通过禁止收集 Unique Key 表的 Value 列统计信息来优化 Unique Key 表性能。# 19563

问题修复

  • 对于 Colocation 表,可以通过命令手动指定副本状态为 bad: ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "10003", "backend_id" = "10001", "status" = "bad"); ,如果 BE 数量小于等于副本数量,则该副本无法被修复。# 17876
  • 启动 BE 后进程存在但是端口无法启动。# 19347
  • 子查询使用窗口函数时,聚合结果不准确。# 19725
  • 首次刷新物化视图时 auto_refresh_partitions_limit 设置的限制不生效,导致所有分区都做了刷新。 # 19759
  • 查询 CSV 格式的 Hive 表时,由于 ARRAY 数组中嵌套了复杂数据类型 (MAP 和 STRUCT)而导致的问题。# 20233
  • 使用 Spark connector 查询超时。# 20264
  • 两副本的表如果其中一个副本出现问题,无法自动修复。# 20681
  • 物化视图查询改写失败而导致查询失败。# 19549
  • 因 db 锁引起的 metrics 接口超时。# 20790
  • Broadcast Join 查询结果错误。# 20952
  • 建表时使用不支持的数据类型时返回空指针。# 20999
  • 开启 Query Cache 后使用 window_funnel 函数导致的问题。# 21474
  • CTE 优化查询改写后导致选择优化计划耗时过长。# 16515

2.5.6

发布日期:2023 年 5 月 19 日

功能优化

  • 优化了因 thrift_server_max_worker_threads 过小导致 INSERT INTO SELECT 超时场景下的报错信息。 #21964
  • CTAS 创建的表与普通表一致,默认为 3 副本。 #22854

问题修复

  • Truncate 操作对分区名大小写敏感导致 Truncate Partition 失败。 #21809
  • 物化视图创建临时分区失败导致 BE 下线卡住。 #22745
  • 动态修改 FE 参数时,不支持设置空 array。 #22225
  • 设置了 partition_refresh_number property 的物化视图可能无法完全刷新完成。#21619
  • SHOW CREATE TABLE 导致内存中鉴权信息错误。#21311
  • 在外表查询中,对于部分 ORC 文件,谓词会失效。#21901
  • 过滤条件无法正确处理列名大小写问题。#22626
  • 延迟物化导致查询复杂数据类型(STRUCT 或 MAP)错误。#22862
  • 主键模型表在备份恢复中出现的问题。#23384