【PPT/视频回放 已更新】湖畔对话--探索湖仓未来,StarRocks & Friends 2024 杭州站

:star2: 上周六,StarRocks & Friends 2024 杭州站圆满落幕! 在 30+ 度的热浪中,杭州的小伙伴们不畏高温,如约而至,线上的朋友们也在直播间热情参与讨论。

:mag: 本次活动以业界主流的数据湖技术为核心,邀请了来自 Apache Hudi, Apache Amoro, Apache Iceberg 以及 StarRocks 的行业专家,带来精彩的主题演讲。

:microphone: 在圆桌讨论环节,专家们共同探讨了当前热门话题,包括:

  1. 数据仓库、数据湖、还是湖仓?
  2. 表格式的终极选择:Hudi, Iceberg, 还是 Paimon?

:camera_flash: 来自沈阳的朋友特地赶来参加我们的线下活动,每一位小伙伴的参与都使我们的社区更加精彩。点击下方链接查看活动的 PPT、直播回放以及现场的精彩照片!

PPT 下载:
StarRocks Cloud Native Data Lakehouse.pdf (4.6 MB)
基于Apache Amoro与Apache Iceberg的湖仓一体实践.pdf (6.3 MB)
vivo湖仓一体SR-meetup.pdf (2.7 MB)
StarRocks x Paimon构建极速实时数据湖分析.pdf (19.9 MB)

视频回放:
StarRocks Cloud Native Data Lakehouse
基于 Apache Amoro(incubating) 与 Apache Iceberg 的湖仓一体实践
vivo 基于 Hudi + StarRocks 的湖仓一体实践
Paimon x StarRocks 构建极速实时湖仓分析
圆桌讨论-- 数据湖格式大对决:Hudi、Iceberg、Paimon — 哪个是你的最佳选择?

精彩照片回顾:









1赞

目前业界主流的数据湖包括:
Apache Iceberg - 专为大规模分析而设计,支持复杂的大数据类型,提高了数据湖的数据管理能力和性能,确保数据一致性。
Apache Hudi - 支持数据的插入、更新和删除,是一个增量数据湖处理框架,帮助企业构建高效的数据湖。
Apache Paimon - 利用 Flink 和 Spark 构建实时 Lakehouse 架构,通过 LSM(日志结构合并树)结构创新性地引入实时流式更新。
他们之间的具体区别和不同是什么?我该如何针对我自己的业务选择合适的数据湖架构?