(回放/PPT已更新)StarRocks 3.2 全面解读:易用性和性能的双重提升

**回放地址:**https://www.bilibili.com/video/BV14C4y1u7H8/?vd_source=1cb452610138142d1300dd37a6162a88
PPT下载:StarRocks 3.2 全面解读.pdf (10.0 MB)

StarRocks 3.2 版本即将发布,这是 StarRocks 的又一次重大升级,除了进一步完善存算分离架构、数据湖分析和物化视图等重要特性,我们还聚焦于运维操作细节,大大提升了 StarRocks 的易用性,从建表、表变更、数据导入、查询到数据导出的整条链路都变得更加顺滑。

具体而言,在新版本中,优化后的随机分桶机制会根据集群信息、导入中的数据量、以及导入方式按需动态调整 Tablet 数量,让创建出来的分桶大小更符合实际动态数据量;新增的 Fast Schema Evolution 模式可以在不新创建 Tablet、只是修改 FE 上元数据的情况下实现 add/drop column 类型的DDL操作。

对于数据的导入,3.2 版本已经可以使用 PIPE 命令从云存储 S3 或 HDFS 中导入大规模数据和持续导入数据;随着表函数 FILES 功能的进一步完善,INSERT from FILES 基本对齐 Broker Load,而易用性上则大大超越了 Broker Load。

数据导出时,3.2 版本提供了与 INSERT from FILES 相对应的统一导出形式 INSERT INTO FILES,能够很方便地将数据导出为 AWS S3 或 HDFS 中的 Parquet 格式文件。

其它值得重点关注的升级内容还包括:

主键模型(Primary Key)表的索引在本地磁盘持久化,使得存算分离架构功能上继续对齐存算一体;新增支持在 Hive Catalog 中创建、删除 Database 以及 Managed Table,让数据湖分析变得更加强大;支持了物化视图的备份与恢复、且支持自动尝试激活失效的物化视图,使得物化视图管理起来更加方便了……

更多的升级细节和技术原理我们将在直播中为大家一一揭晓

1赞

:+1::+1::+1::+1::+1::+1: