（回放/PPT已更新）StarRocks 3.2 全面解读：易用性和性能的双重提升

CuiCui · 2024年04月15日 12:25

**回放地址：**https://www.bilibili.com/video/BV14C4y1u7H8/?vd_source=1cb452610138142d1300dd37a6162a88
PPT下载：StarRocks 3.2 全面解读.pdf (10.0 MB)

StarRocks 3.2 版本即将发布，这是 StarRocks 的又一次重大升级，除了进一步完善存算分离架构、数据湖分析和物化视图等重要特性，我们还聚焦于运维操作细节，大大提升了 StarRocks 的易用性，从建表、表变更、数据导入、查询到数据导出的整条链路都变得更加顺滑。

具体而言，在新版本中，优化后的随机分桶机制会根据集群信息、导入中的数据量、以及导入方式按需动态调整 Tablet 数量，让创建出来的分桶大小更符合实际动态数据量；新增的 Fast Schema Evolution 模式可以在不新创建 Tablet、只是修改 FE 上元数据的情况下实现 add/drop column 类型的DDL操作。

对于数据的导入，3.2 版本已经可以使用 PIPE 命令从云存储 S3 或 HDFS 中导入大规模数据和持续导入数据；随着表函数 FILES 功能的进一步完善，INSERT from FILES 基本对齐 Broker Load，而易用性上则大大超越了 Broker Load。

数据导出时，3.2 版本提供了与 INSERT from FILES 相对应的统一导出形式 INSERT INTO FILES，能够很方便地将数据导出为 AWS S3 或 HDFS 中的 Parquet 格式文件。

其它值得重点关注的升级内容还包括：

主键模型（Primary Key）表的索引在本地磁盘持久化，使得存算分离架构功能上继续对齐存算一体；新增支持在 Hive Catalog 中创建、删除 Database 以及 Managed Table，让数据湖分析变得更加强大；支持了物化视图的备份与恢复、且支持自动尝试激活失效的物化视图，使得物化视图管理起来更加方便了……

更多的升级细节和技术原理我们将在直播中为大家一一揭晓

数据小黑 · 2023年12月15日 00:38