Hi 社区的朋友们,
随着 StarRocks 的蓬勃发展,社区每个月都有许多令人兴奋的事在发生。为了让社区的小伙伴们能一站式获取 StarRocks 的最新资讯,我们推出了 StarRocks 社区动态月刊,内容包含产品动态、社区活动、技术干货回顾、社区人物介绍等,让你不错过每一件重要的事!
下面就让我们一起来回顾这精彩的 5 月吧!
产品动态
1. 最新版本 StarRocks 2.2.0
Release note: StarRocks-2.2 Release Notes(最新版本:2.2.8,发布日期:2022年10月17日)
新版本功能 Highlight
- 资源隔离
资源隔离一直是用户呼声最高的需求之一,在 2.2 版本中我们发布了 Resource group(资源组)的功能。通过资源组,我们可以给大查询和小查询设置不同的资源组,给不同资源组配置不同的 CPU 和内存资源,从而大大降低不同负载在同一个集群执行时的相互干扰。在我们的测试集中,对小查询的响应延迟有 2-4 倍的提升,明显优于没有使用资源组的版本,部分场景接近物理隔离的效果。
另一方面,通过 Pipeline 引擎我们也在资源组中实现了弹性调度的能力。在集群空闲的时候,查询会充分利用资源,当集群负载变大时,资源组会按照比例伸缩至原有的资源,这样可以获得比物理隔离更好的资源利用率。
- Java UDF 框架
虽然 StarRocks 已经提供了很多类型的函数,但是用户仍然需要用到各种处理特殊的逻辑,特别是在做 ETL 时。StarRocks 2.2 中提供了 Java UDF 框架,包括 Scalar Funciton、Aggragate Function、Window Function、Table Function 都可使用用户自定义的函数来实现,这样用户可以在 StarRocks 上更好地进行自定义的功能扩展,包括可以迁移一些来自 Hadoop 生态的 UDF 处理逻辑。
- JSON 数据类型
StarRocks 2.2 版本中预发布了JSON 一期功能:提供 JSON 类型,用二进制方式代替之前 JSON 格式的字符串,使得性能提升至原来的 2 倍;同时也提供了更多 JSON 函数,包括 JSON_EACH 这种 Table function。
- 数据湖分析优化
在 2.2 中我们优化了 Apache Hive 外表中基于对象存储(Amazon S3、阿里云 OSS)的外部表的性能,优化后基于对象存储的查询性能可以与基于 HDFS 的查询性能基本持平。另外,通过支持 ORC 格式文件的延迟物化,降低了一些过滤度高的查询 IO,还针对一些真实用户场景中小文件过多的问题进行了查询优化。
- 主键模型支持部分列更新
Primary Key 模型支持了部分列更新功能,已经可以通过 Stream load / Broker load / Routine load 对宽表的部分列进行实时更新。在订单实时更新、多流实时 JOIN 等场景下,使用部分列更新的功能可以降低实时更新任务的处理复杂性,不需要用户维护额外的窗口,也不需要去额外的读取不需要更新的数据。
如果你想了解更多关于新功能的解说,请点StarRocks 2.2 新版本特性介绍!
2. LTS (Long-term Support) StarRocks 2.0.5 & 2.0.6
Release notes: StarRocks-2.0 (LTS) Release Notes(最新版本:2.0.9,发布日期:2022年8月6日)
3. 稳定版 StarRocks 2.1.6 & 2.1.7
Release notes: StarRocks-2.1 Release Notes(最新版本:2.1.13,发布日期:2022年9月6日)
推荐阅读
技术干货
马蜂窝×StarRocks:OLAP 架构升级,开启极速统一新旅程
360 × StarRocks:如何构建“极速统一”的数据分析新范式
精选实用帖
注意 StarRocks 的恢复盲区:drop schema
请大家多多收藏~
社区人物-流木 @Loong
流木,物联网领域的大数据开发者,主导将 StarRocks 应用在所在公司多个大数据项目。在 StarRocks 社区记录学习了几百个问答后,他撰写了 7 章 39 节 10 多万字的 “手把手教你玩转StarRocks”系列教程 ,被社区伙伴戏称为“流木大佬”。
这次专访中,他与我们分享了他与 StarRocks 社区的故事:行如蜗牛,决定入海 | 访 StarRocks 社区大使流木
社区活动回顾
阿里云 EMR StarRocks 发布会,揭秘极速数据糊分析内幕!
StarRocks x Apache Hudi:面向 Apache Hudi 的 StarRocks 外表特性解析
StarRocks on AWS: 如何对历史数据和实时数据进行极速统一的分析
下月活动预告
StarRocks 极客营:SQL Parser、Analyzer 专场
直播:梦龙手把手教你玩转 StarRocks
直播 :StarRocks x 37 手游
参与社区|Be A Rock Star!
新晋 committer:
恭喜 @mofeiatwork 成为 StarRocks 社区 Committer 一员!
莫飞在社区的主要贡献:
-
设计实现了JSON类型,增强了StarRocks 对半结构化数据的处理能力
-
重新设计了 Sort 算法,在原有基础上获得数倍的性能提升
-
参与到 Pipeline 引擎及资源组项目的开发,增强 StarRocks 的高并发和弹性能力
莫飞:作为 StarRocks 的 Committer,我期望自己能进一步为社区和用户创造更大的价值,并通过技术创新将 StarRocks 的性能和用户体验做到极致。欢迎有志之士来找我聊聊,我们来一起搞事情!
论坛贡献 top 3:
@shemplle 80 posts
@JiangLai 8 posts & 2 topics
@U_1651041279778_8953 8 posts & 7 topics
StarRocks GitHub 贡献 top 5:
感谢你的阅读,期待下个月看见你出现在我们的月刊中!
也欢迎你关注这些我们常出没的地方