StarRocks 1-2社区月刊 Ver.2025


大家好:wave:,欢迎来到《StarRocks 2025 1-2 月社区动态》!

StarRocks 社区月刊回来啦!:tada: 这次直接双倍更新,把 1 月和 2 月的精彩动态一次打包送上!

过去两个月,社区热闹非凡——2024 年度贡献者和年度报告新鲜出炉,StarRocks 3.4 版本正式发布,2025 年路线图也已官宣,未来发展方向一目了然!

另外,我们还开启了 StarRocks 全球用户精选案例 系列,带你看看全球各行各业如何用 StarRocks 玩转数据分析,后续还有更多干货放送,敬请期待!

:new: 技术动态

:wrench: 版本发布

在考虑升级 StarRocks 的小伙伴,这里有你们的升级手册 :point_left:t2:

3.4.0 3.3.9

3.2.15

3.2.14

3.1.17

3.0.9

:spiral_notepad: 文档动态

:books: StarRocks 文章回顾

:new: StarRocks 全球用户精选案例

StarRocks x Demandbase ,助力北美 ABM 营销平台降本 90%!

Demandbase 于 2007 年创立于美国加州旧金山,专注于 AI 驱动的 ABM 平台,助力 B2B 营销人员实现业务突破。通过将 ClickHouse 替换为 StarRocks,Demandbase 解决了性能与灵活性问题。新架构基于 Apache Iceberg 和 StarRocks,显著提升了数据处理效率,硬件资源减少 60%,存储成本降低 90%,ETL 管道简化,运营负担大幅减轻。

用户案例:

StarRocks 在爱奇艺大数据场景的实践

本文主要介绍了爱奇艺 OLAP 引擎演化及引入 StarRocks 后的效果。

  • 在广告业务中,StarRocks 替换 Impala+Kudu 后,接口性能提升 400%,P90 查询延迟缩短 4.6 倍。

  • 在“魔镜”数据分析平台中,StarRocks 替代 Spark 达 67%,P50 查询提升 33 倍,P90 提升 15 倍,节省 4.6 个人天。

小红书湖仓架构的跃迁之路

本文整理自小红书工程师在 StarRocks 年度峰会上的分享,介绍了小红书自助分析平台中,StarRocks 与 Iceberg 结合后,如何实现极速湖仓分析架构。

与原有架构相比,湖上分析架构的 P90 查询性能提升了 3 倍,目前查询 响应时间 稳定在 10 秒以内。 同时,采用 Iceberg 存储格式后,尽管数据量和行数保持不变,但实际存储空间相较原有 ClickHouse 存算分离版本减少了一半。

腾讯大数据基于 StarRocks 的向量检索探索

向量检索功能已应用到腾讯内部多个场景,引入 StarRocks 后,业务不仅不需要维护多套数据库还在性能上有了显著的提升:

  • 性能提升 :查询延迟从原本的 15 秒 (TOP 10,000 数据)缩短到 2 秒 ,效率提升超过 7 倍

  • 成本优化 :在实际验证中,系统运行成本降至原来的 1/3

从 Spark 到 StarRocks:实现58同城湖仓一体架构的高效转型

本文介绍了 58同城在其数据探查平台中引入 StarRocks 的实践,旨在提升实时查询性能。在面对传统 Spark 和 Hive 架构的性能瓶颈时,58 同城选择 StarRocks 作为加速引擎,增强数据湖的分析能力。在迁移过程中,团队克服了多个兼容性问题,并对系统进行了稳定性和易用性的改进,特别是在Java UDF 支持和 SQL 黑名单功能方面。项目实施一年多以来,58 同城取得了显著的成果:

  • 日均迁移 SQL 数量约 6.5 万条 ,查询成功率稳定在 98% 以上

  • 查询性能较迁移前提升 20 倍以上 ,平均查询时间缩短至 3.3 秒 ,P90 查询时间为 5 秒

40% 降本:多点 DMALL x StarRocks 的湖仓升级实战

多点 DMALL 成立于2015年,持续深耕零售业,为企业提供一站式全渠道数字零售解决方案 DMALL OS。作为 DMALL OS 数字化能力的技术底座,大数据平台历经多次迭代平稳支撑了公司 To B 业务的快速开展。随着国家产业升级和云原生技术的成熟,平台架构也从存算一体逐步转向存算分离。本文将以 StarRocks 的升级演进为例,分享这一过程中的探索与实践。

通过引入 StarRocks 的存算分离架构、Lakehouse ( Apache Iceberg 外表查询)与 StarRocks on Kubernetes 等特性,多点 DMALL 大数据平台取得了显著成效:

  • 计算资源使用率提高 20%,存储成本降低 40%。

  • 数据建模工作减少,开发效率提升 20%。

  • 新集群部署时间缩短至 1 小时内。

产品发布

StarRocks 3.4 发布–AI 场景新支点,Lakehouse 能力再升级

在之前的版本中,StarRocks 已对 Lakehouse 的性能与易用性进行了一年多的打磨; 在 3.4 版本中,我们聚焦 AI 场景的扩展,推出了 Vector Index、Python UDF 支持,并实现了 Arrow Flight 协议, 为数据分析和 AI 检索场景提供更强大的功能和性能支持,帮助用户更高效地实现业务目标。

Lakehouse 的优化也在此次版本中得到了进一步的提升:从数据文件管理、数据读取、统计辅助、查询优化到数据缓存等多个环节进行了深度优化,显著提升了系统性能。同时,湖生态对接能力也得到了持续完善,建表、数据导入和系统稳定性等方面的改进进一步增强了 StarRocks 的易用性和可靠性。

年度贡献人物/年度报告

湖仓进化,极速统一|StarRocks 2024 社区年度报告

StarRocks Awards 2024 年度贡献人物

:mailbox_with_mail: 来自社区小伙伴的文章/视频

感谢以下小伙伴们的分享如希望自己的博客被收录在社区月刊里,欢迎私信、评论或是联系 SR 小助手~

技术文章:

【后台技术】StarRocks执行原理与SQL性能优化策略探索 (作者:Deltaverse增量空间)

ElasticSearch、ClickHouse、StarRocks介绍与选型(作者:春哥茶话会 )

StarRocks高效聚合源码解析(作者:程序员学习随笔 )

开源大数据 OLAP 的思考及最佳实践 (作者:浪尖聊大数据)

Paimon集成Fluss将数据新鲜度从分钟级提升至毫秒级,并用StarRocks进行数据实时查询展示 (作者:甜或师兄 大数据技能圈)

StarRocks数仓选型全面解析(作者:未来的追光者)

StarRocks强大的实时数据分析 (作者:boonya)

实践类文章:

StarRocks Compaction&内存异常问题深度剖析 (作者:数据圈)
StarRocks | 常见问题处理(一) (作者:DBKiller)

StarRocks | 常见问题处理(二)(作者:DBKiller

StarRocks 开发环境搭建踩坑指北之存算分离篇(作者:crossoverJie)
StarRocks实际数据中字符串的基数分布,如何统计?(作者:阿龙大数据)

Starrocks中Flat Json功能如何使用?(作者:阿龙大数据)

用户分享 | Flink+Paimon+StarRocks+Dinky 流式湖仓分层实践验证(作者:俊瑶先森 Dinky开源)

新闻类文章:

StarRocks 全球用户猛增,传统数据库厂商该担心了! (作者:玉儿村庄新闻)

:sparkles: 社区活动

:tv: 活动回顾

StarRocks 2025 Roadmap 全面解读

2 月 19 日 19:00-20:30,StarRocks TSC Member 赵恒、康凯森在线全面解读 StarRocks 2025 Roadmap,我们也邀请到StarRocks 社区 Champion/阿里云计算平台开源 OLAP 负责人范振、腾讯游戏数据分析引擎研发工程师黄奕文、StarRocks Active Contributor 严祥光分享最新项目进展,包括智能优化、Paimon 生态等方向。 :arrow_double_down: 回放 & PPT 下载:[PPT/直播回放已更新]StarRocks 2025 Roadmap 全面解读

StarRocks 3.4:打造 AI 时代的智能数据基座,应用场景全面扩展

更强的 AI 场景支持

  • 引入 Vector Index, 大幅提升向量检索性能

  • 支持 Arrow Flight ,实现更快速、流畅的大数据传输

  • Python UDF ,让开发者在 AI 推理和数据处理上更加得心应手

性能优化,全面进化:

  • 数据湖分析能力: 优化性能,提升易用性,进一步完善对 Iceberg 和 Delta Lake 的支持

  • 建表与导入优化: 统一分区设计,高并发实时导入与批量导入更易用

  • 稳定性与安全性 :支持优雅退出、checkpoint,备份与恢复功能更全面

  • :arrow_double_down: 回放 & PPT 下载:【PPT/视频回放已更新】StarRocks 3.4版本详细解读

:hugs: 参与社区|Be A Rockstar!

:trophy: StarRocks GitHub Monthly Contributors

感谢这些小伙伴为 StarRocks 添砖加瓦,StarRocks 因你而伟大!:adult::rocket::heart:

@wanpengfei-git @wyb @kevincai@trueeyu @LiShuMing @Seaven @stdpain @gengjun-git @srlch @EsoragotoSpirit @Youngwb @dirtysalt @sevev @DanRoscigno @banmoy @satanson @andyziye @xiangguangyxg @packy92 @luohaha @stephen-shelby @meegoo @luohaha @HangyuanLiu @ZiheLiu @decester @silverbullet233 @nshangyiming @duanyyyyyyy @CLAassistant @wxl24life @zombee0

@jaogoy @SHaaD94 @DorianZheng @starrocks-xupeng @wangsimo0 @rohitrs1983 @miomiocat

@before-Sunrise @maggie-zhu @wangruin @zhaohehuhu @kaijianding @crossoverJie @chenminghua8

@chaoyli @maver1ck @zenoyang @KKould

新晋 Contributor :clap::clap:

@ahmadov @click9000 @Aurafin @Xikl @kritchie @amoghmargoor @dupen01 @dq1201 @Wenjun7J

因为之前用的平台不能用了,换了一种导数方式,可能会有贡献人数显示不全的情况。:joy: 如果你在有过PR 合并但没有显示在上面的,不好意思把你漏掉了~麻烦留个言让我们知道。还有,记得来领个周边小礼物:@贡献者们,速来解锁 Contributor 限定 T 恤

感谢你的阅读,有任何的问题欢迎在论坛下方与我们交流!

也欢迎你关注这些我们常出没的地方:point_down:t2:

:star: GitHubBilibili微信交流群:question:论坛| 公众号:StarRockslabs