✨ StarRocks 5 月社区动态


Hi 社区的朋友们,

随着 StarRocks 的蓬勃发展,社区每个月都有许多令人兴奋的事在发生。为了让社区的小伙伴们能一站式获取 StarRocks 的最新资讯,我们推出了 StarRocks 社区动态月刊,内容包含产品动态、社区活动、技术干货回顾、社区人物介绍等,让你不错过每一件重要的事!

下面就让我们一起来回顾这精彩的 5 月吧!:tada:


:new: 产品动态

1. 最新版本 StarRocks 2.2.0

Release note: StarRocks-2.2 Release Notes(最新版本:2.2.8,发布日期:2022年10月17日)

:sparkles: 新版本功能 Highlight

  • 资源隔离

资源隔离一直是用户呼声最高的需求之一,在 2.2 版本中我们发布了 Resource group(资源组)的功能。通过资源组,我们可以给大查询和小查询设置不同的资源组,给不同资源组配置不同的 CPU 和内存资源,从而大大降低不同负载在同一个集群执行时的相互干扰。在我们的测试集中,对小查询的响应延迟有 2-4 倍的提升,明显优于没有使用资源组的版本,部分场景接近物理隔离的效果。

另一方面,通过 Pipeline 引擎我们也在资源组中实现了弹性调度的能力。在集群空闲的时候,查询会充分利用资源,当集群负载变大时,资源组会按照比例伸缩至原有的资源,这样可以获得比物理隔离更好的资源利用率。

  • Java UDF 框架

虽然 StarRocks 已经提供了很多类型的函数,但是用户仍然需要用到各种处理特殊的逻辑,特别是在做 ETL 时。StarRocks 2.2 中提供了 Java UDF 框架,包括 Scalar Funciton、Aggragate Function、Window Function、Table Function 都可使用用户自定义的函数来实现,这样用户可以在 StarRocks 上更好地进行自定义的功能扩展,包括可以迁移一些来自 Hadoop 生态的 UDF 处理逻辑。

  • JSON 数据类型

StarRocks 2.2 版本中预发布了JSON 一期功能:提供 JSON 类型,用二进制方式代替之前 JSON 格式的字符串,使得性能提升至原来的 2 倍;同时也提供了更多 JSON 函数,包括 JSON_EACH 这种 Table function。

  • 数据湖分析优化

在 2.2 中我们优化了 Apache Hive 外表中基于对象存储(Amazon S3、阿里云 OSS)的外部表的性能,优化后基于对象存储的查询性能可以与基于 HDFS 的查询性能基本持平。另外,通过支持 ORC 格式文件的延迟物化,降低了一些过滤度高的查询 IO,还针对一些真实用户场景中小文件过多的问题进行了查询优化。

  • 主键模型支持部分列更新

Primary Key 模型支持了部分列更新功能,已经可以通过 Stream load / Broker load / Routine load 对宽表的部分列进行实时更新。在订单实时更新、多流实时 JOIN 等场景下,使用部分列更新的功能可以降低实时更新任务的处理复杂性,不需要用户维护额外的窗口,也不需要去额外的读取不需要更新的数据。

如果你想了解更多关于新功能的解说,请点:point_right:StarRocks 2.2 新版本特性介绍

2. LTS (Long-term Support) StarRocks 2.0.5 & 2.0.6

Release notes: StarRocks-2.0 (LTS) Release Notes(最新版本:2.0.9,发布日期:2022年8月6日)

3. 稳定版 StarRocks 2.1.6 & 2.1.7

Release notes: StarRocks-2.1 Release Notes(最新版本:2.1.13,发布日期:2022年9月6日)


:books: 推荐阅读

技术干货

StarRocks 技术内幕:实时更新与极速查询如何兼得

马蜂窝×StarRocks:OLAP 架构升级,开启极速统一新旅程

360 × StarRocks:如何构建“极速统一”的数据分析新范式

精选实用帖

StarRocks-Profile分析及优化指南

StarRocks 的 kafka 导入任务管理

注意 StarRocks 的恢复盲区:drop schema

当前 FE 的监控项

当前 BE 的监控项

:pray: 请大家多多收藏~

社区人物-流木 @Loong

流木,物联网领域的大数据开发者,主导将 StarRocks 应用在所在公司多个大数据项目。在 StarRocks 社区记录学习了几百个问答后,他撰写了 7 章 39 节 10 多万字的 “手把手教你玩转StarRocks”系列教程 ,被社区伙伴戏称为“流木大佬”。

这次专访中,他与我们分享了他与 StarRocks 社区的故事:行如蜗牛,决定入海 | 访 StarRocks 社区大使流木


:tv: 社区活动回顾

阿里云 EMR StarRocks 发布会,揭秘极速数据糊分析内幕!

StarRocks x Apache Hudi:面向 Apache Hudi 的 StarRocks 外表特性解析

StarRocks on AWS: 如何对历史数据和实时数据进行极速统一的分析

快来跟社区一起“共享式”学习!你分享,我送书!

:fire: 下月活动预告

StarRocks 极客营:SQL Parser、Analyzer 专场

直播:梦龙手把手教你玩转 StarRocks

直播 :StarRocks x 37 手游


:hugs: 参与社区|Be A Rock Star!

:trophy: 新晋 committer:

恭喜 @mofeiatwork 成为 StarRocks 社区 Committer 一员!:tada:

莫飞在社区的主要贡献:

  • 设计实现了JSON类型,增强了StarRocks 对半结构化数据的处理能力

  • 重新设计了 Sort 算法,在原有基础上获得数倍的性能提升

  • 参与到 Pipeline 引擎及资源组项目的开发,增强 StarRocks 的高并发和弹性能力

:speech_balloon: 莫飞:作为 StarRocks 的 Committer,我期望自己能进一步为社区和用户创造更大的价值,并通过技术创新将 StarRocks 的性能和用户体验做到极致。欢迎有志之士来找我聊聊,我们来一起搞事情!

:trophy: 论坛贡献 top 3:

@shemplle 80 posts

@JiangLai 8 posts & 2 topics

@U_1651041279778_8953 8 posts & 7 topics

:trophy: StarRocks GitHub 贡献 top 5:

感谢你的阅读,期待下个月看见你出现在我们的月刊中!:sunglasses:

也欢迎你关注这些我们常出没的地方:point_down:t2:

:star: GitHub:tv: Bilibili:speech_balloon: 知乎:newspaper: 公众号:StarRockslabs

1赞