Bitmap 最佳实践和使用手册 1 - 格式

相关实践文档整理和优化还在整理中,有什么 bitmap 使用的问题,可以直接论坛联系。

Bitmap 相关的问题可以加 wx: lxhhust350@qq.com 细聊

格式

当前 Bitmap 支持 5 种表示格式:

  • String 格式: 1,2,3,4,5,6

  • Binary 格式: Bitmap 的序列化格式

  • Base64 格式: Bitmap 序列化后,再 base64 编码

  • 明细格式: Bitmap 展开成多行 Bigint

  • Array 格式: [1,2,3,4,5,6]

  • 压缩率: Binary > Base64 > String/Array > 明细

  • Base64 相对于 Binary 格式,大小增加 33%,一般用于只能通过可见字符导入的场景 (CSV/JSON)

  • Base64/Binary 格式的数据可能通过 HiveUDF/StarRocks内置函数/JavaDemo 生成