【2021-11-06】“初雪”与“向量化” | StarRocks Hacker Meetup 小记

StarRocks Hacker Meetup 是 StarRocks 社区组织的面向开发者的线下活动,旨在通过面对面的交流帮助开发者深入了解 StarRocks 核心功能的实现原理,和开发者共同探讨数据库领域的前沿技术。

第一季 Hacker Meetup 共4期,将持续2个月,每两周探讨一个 StarRocks 的核心功能。欢迎大家持续关注。第二期 Hacker Meetup 将在11月20日与大家见面!

11月16日,北京迎来了2021年的初雪。StarRocks 社区也迎来了第一期 Hacker Meetup:向量化编程的精髓。尽管雨雪交加,但开发者们热情不减,现场座无虚席。小伙伴们对这次的活动都感觉收获满满:




干货回顾
在本次 Meeup上,康凯森同学深入浅出的从几个方面向大家介绍了数据库向量化编程的要点:

  • How to build a fast database

如何构建一个性能卓越的数据库?凯森分别从预处理 VS 现场处理、架构、数据流、系统资源4个角度进行了回答。

  • The basics of CPU vectorization

凯森用 Top-down 的性能分析方法介绍了影响 CPU 性能的关键点,然后介绍了 CPU 向量化的基本概念和6种向量化编程的方式。

  • The key points of database vectorization

数据库的向量化不仅仅是 CPU 指令的向量化,而是一个巨大的性能优化工程。凯森首先介绍了数据库向量化的关键点:数据组织方式、算子和表达式的向量化,SIMD 如何加速 Filter、Agg和Join,然后通过具体实例介绍了数据库单核 CPU 性能优化的几个关键点:数据结构和算法、自适应策略、SIMD 优化、内存管理优化、C++ Low Level 优化和 CPU Cache 优化等,最后推荐了一些好用的性能优化工具。

  • Thinking of StarRocks vectorization

凯森介绍了 StarRocks 向量化工程的一些思考和总结。


下期预告

时间:2021年11月20日 14:00-17:00

地点:拓荒族 三层(中关村创业大街10号楼)

演讲嘉宾:常冰琳(StarRocks 核心研发,Apache Kudu PMC)

*受疫情影响的原因,本次 Meetup 入场券有限,先到先得。社区将会审核您的报名信息,StarRocks 项目的 Contributor 拥有优先通过权,请以报名成功的短信通知为准。

这个冬天,让 StarRocks 陪你尽数领略技术之美!

1赞

Meetup录屏 能否分享出来?

我们后续会进行线上直播,对第一季hacker meetup的内容进行优化和精炼,欢迎关注社区活动最新进展

森神的PPT能共享下么?

社区近期在筹备线上分享,欢迎随时关注

:+1::+1::+1::+1::+1::+1::+1::+1::+1::+1::+1::+1::+1::+1: