降本增效，StarRocks 在同程旅行的实践

CuiCui · 2024年11月23日 14:46

作者：周涛同程旅行数据中心大数据研发工程师

同程旅行是中国在线旅游行业的创新者和市场领导者。作为一家一站式平台，同程旅行致力于满足用户旅游需求，秉持 “让旅行更简单、更快乐” 的使命，主要通过包括微信小程序、APP、轻应用及其他渠道在内的线上平台，为用户提供几乎涵盖旅游所有方面的全面创新产品和服务选择，涵盖交通、住宿、景点门票预订及各种配套增值旅游产品及服务，旨在满足用户在整个旅途中不断变化的旅游需要。目前，同程旅行的月活跃用户已达到2亿多人。
为了提升数据分析查询性能，同时降低人力和硬件成本，公司的出行、住宿和公共等多个业务线都已接入并使用了 StarRocks 技术。

同程旅行有多年的 OLAP 使用经验，随着业务增长和变化，促使我们需要不断探索更合适的组件来满足需求。在这方面，StarRocks 作为一款优秀的数据库，在同程旅行的生产环境中得到了广泛应用，涵盖实时、离线和 Customer Data Platform（顾客数据平台，以下简称 CDP）等多个应用场景。

本文将从同程旅行 OLAP 平台演进、业务痛点和 StarRocks 是如何解决当前业务痛点这几个部分详细介绍 StarRocks 在同程旅行的生产落地实践。

#01

同程旅行的 OLAP 平台演进

随着公司的业务变化和用户量的增加，数据量也在不断增加。数据分析场景变得越来越多样化，对实时分析的时效性要求也更高了。为了更好地满足这些需求，同程旅行的 OLAP 平台也在不断演进，整体的发展过程大致分为三个阶段：

第一阶段： 以 Druid+Kylin 为基础构建的数据分析体系，满足了当时对于离线数据分析加速的需求，但在使用过程中也逐渐暴露出 SQL 分析、联邦查询、BI 兼容等方面能力不足与 CUBE 运维成本较高等一系列问题；

第二阶段（引入 StarRocks 前）： 在这一阶段，我们采用 ClickHouse+Greenplum 支撑实时、离线业务的分析处理，在一定程度上解决了上一阶段存在的问题；

第三阶段： 由 StarRocks 作为统一的 OLAP 组件，减少多组件的维护压力。同时注重在企业内部与相关数据平台的集成，提升用户使用体验，降低用户组件使用和切换成本。

在说明我们为什么选择 StarRocks 作为我们新一代的 OLAP 组件前，我们需要先了解原有平台架构的不足：

ClickHouse：主要用于用户行为轨迹和订单实时数据存储和分析
Greenplum：主要用于公司内部的灵动分析看板，做分析报表使用

如上图所示，在原始架构中，对于实时场景，业务数据通过 Kafka 传入 Flink，在 Flink 中进行清洗、打宽表等逻辑处理，之后将结果数据导入 ClickHouse 中；对于离线场景，数据统一存储在 HDFS 中，通过 Hive+Spark 进行清洗处理后，将结果数据传入 Greenplum 中。

实时场景

主要涉及业务订单数据，数据可以通过前端用户埋点到 Kafka，或者订阅业务订单数据库 Binlog，实时写入到 MQ，然后使用 Flink SQL，关联维度表，将数据打宽，最后写入到 ClickHouse 中。

离线场景

将实时的用户埋点数据或订单库离线同步数据写入到 HDFS 中，然后经过离线调度做 ETL 数据清洗，再搬运到 ClickHouse 或 Greenplum 中。然而，在使用过程中，我们发现实时和离线分离架构存在一些问题：

分离架构导致开发使用极度不方便，且浪费计算存储资源；
组件技术栈不统一，导致业务人员需要熟悉多种语法；
多组件造成了极高的运维成本。

为解决在使用 ClickHouse、Greenplum 过程中遇到的性能、运维和成本等各方面的问题，我们进行了一些调研，开始对比和了解一些新的 OLAP 组件。接下来，我们将进一步说明使用 ClickHouse 和 Greenplum 架构所带来的业务痛点。通过这些问题的阐述，我们可以更好地理解为何需要寻找新的解决方案。

01 ClickHouse + Greenplum 架构带来的业务痛点**

目前，同程 OLAP 组件被广泛使用，并已集成到实时开发平台、离线开发平台、灵动分析、数据地图和快速取数等多个平台系统中。在业务方面，主要涉及以下三类场景：

1.1 实时数据分析

在使用实时数据分析的业务场景，我们主要针对用户行为埋点、用户实时订单等数据进行冷热存储。实时热数据需要存储 30 天至一年不等的时间数据，用于高性能要求的实时统计分析；历史离线数据存储在 HDFS。 在查询实时数据时，如果涉及多表关联或者关联历史数据时， 当前组件 性能无法满足，需要提前离线清洗，导致数据时效性 较低。

1.2 灵动数据报表

在使用灵动数据报表的业务场景，用户在离线数仓中清洗出 DWD 或 ADS 层表，通过离线开发平台导入到 Greenplum 中，然后在灵动分析中配置数据集，以拖拉拽的形式生成看板，提供给分析决策使用。然而， 在高峰时期，我们经常遇到查询速度慢甚至查询超时等问题，这给业务带来了困扰。

1.3 用户画像 & CDP

在用户画像和 CDP 的场景中，我们会根据用户基本信息、消费数据和行为数据等生成对应标签数据，以创建用户画像，并进行人群圈选和漏斗分析等。

之前我们使用了 ClickHouse 作为存储分析引擎，但随着 CDP 需求的变化，业务场景更加复杂， 涉及到多表关联场景以及宽表和 BitMap 关联场景，用户对实时分析的查询性能 提出了 更高的要求。 经过测试 ， ClickHouse 已 无法很好的满足。

针对当前 ClickHouse+Greenplum 体系存在的各种问题，我们开始了基于 StarRocks 构建分析体系 3.0 阶段的升级演变。

#02

StarRocks 在同程旅行的应用与实践

01 选择 StarRocks 的原因

为了解决上述问题，我们追求在新的 OLAP 组件中实现简单、高速和统一的特点（包括支持联邦分析）。为此，我们进行了 StarRocks、ClickHouse、Greenplum 和 Presto 等 OLAP 组件的比较。我们比较了数据摄入速度、查询性能、内存占用率、维护成本和易用性等指标。通过这些比较，我们希望找到最适合我们业务需求的 OLAP 组件。

下图展示了这些组件的具体比较结果：

查询性能优异：

StarRocks 是一款分布式列式存储分析数据库，它具有非常高的查询性能，尤其适用于实时数据分析和查询场景。与ClickHouse 相比，StarRocks 在多表联合查询方面表现更出色，尤其在 Primary Key 模型方面，其在实时动态更新和查询性能方面都表现优异。

维护难度低：

StarRocks 由 FE 和 BE 两类组件组成，不依赖于第三方组件，可以开箱即用。而且，StarRocks 具有良好的可扩展性，集群扩缩容方便，可以根据需求动态扩展集群规模，灵活提高系统性能。此外，数据可以在节点之间自动均衡，无需人为干预。

方便易用：

StarRocks 采用标准 SQL 协议且兼容 MySQL 协议，可以轻松集成到现有系统中。此外，在实时写入方面，官方也提供了 flink-connector-starrocks，写入可实现 exactly-once。另外，StarRocks 还具备方便的联邦查询功能，避免了数据搬运带来的资源消耗，从而提高了系统性能。

经过多方比较，我们最终选择了 StarRocks 作为统一的 OLAP 组件，并预计在未来逐步完成统一 OLAP 层的工作。

02 StarRocks 的引入

同程旅行主要在以下三个场景中使用 StarRocks：实时数据分析、离线报表和 CDP 系统。

随着 StarRocks 的接入，新的数据应用流程架构如下：

2.1 使用 StarRocks 解决当前痛点

1 ）实时数据分析的整体时效性提升

在实时应用场景中，业务数据进入到 Kafka 或者 TurboMQ，然后通过 Flink 任务或 Flink SQL 任务进行业务计算转换，最终通过 flink-starrocks-connector 实时写入到 StarRocks，进行实时指标统计或者实时数据分析。 实时链路 中不再涉及 关联打宽， 缩短了 链路，提升 了整体的 时效性 。同时，StarRocks 采用星型模型组织数据，减少数据冗余存储。

以下是我们实际中的一个 Flink SQL 案例：

通过将 StarRocks 集成到实时开发平台，用户可以轻松快速地将实时数据导入 StarRocks 并进行使用。

2）离线报表查询性能大幅提升

我们已经成功将 StarRocks 数据源集成到灵动分析系统中。现在可以将 StarRocks 中的表创建为灵动中的数据集，进行分析看板配置，并实时写入数据。此外，无需重复清洗，还可以直接进行报表配置。由于 StarRocks 支持标准 SQL 并兼容 MySQL 协议，因此系统集成 StarRocks 数据源非常便捷。 切换引擎后，与 Presto 和 Greenplum 相比，报表查询性能大幅提升（在某些实际场景中，相较于 Greenplum ，查询性能提升近一倍）。

下图是对 14 个 SQL 耗时进行统计对比：

3） CDP 系统查询效率提高

CDP 是一种数据管理平台，它可以集成多方数据，帮助企业更好地了解用户行为、喜好和需求，从而制定更加精准的运营策略。CDP 系统上线后，可以服务于公司各个事业部，对用户进行分层或保存人群进行运营，从而极大地提升了运营效率并降低了运营成本。

CDP 系统的具体工作流程如下：

1）数据导入 ：

当前先知系统有 1000 多个历史人群需要作为人群圈选的条件，而这 1000 多个人群数据的导入耗时较高，存在性能瓶颈。经过调研，使用以下方法可以很好的解决这个问题：

将 String 类型的用户 ID 转换成 Long 类型的 oneId；
然后通过 Spark 任务将 oneId 转换成 Java 代码的 BitmapValue 对象；
在所有的相同 key 的 BitMap 合并后，转换成 Base64string，这样将相同的 key 的数据合并成一条数据，导入到 StarRocks 中。

经过验证，采用以上方法可以大大提高数据导入性能，将 1.5 亿条数据的 10 个任务同时导入的耗时从 10 分钟以上下降到 10s 以内，并且可以减少导明细数据的集群资源消耗。

如上图所示，根据数据监控显示，红框内时间段是明细导入的网络传输量，而其他时间段为 BitMap 合并 Base64 后的传输量。这两者之间的传输量相差约 10 倍。针对这个问题，我们正在努力优化导入代码，并将其整理成 Demo，以便提交给社区供大家参考使用。

2 ）人群圈选 ：

接下来我们需要通过 BitMap 的函数操作，对用户选择的条件进行人群圈选。通过将条件组合成 StarRocks 对应的 BitMap 的 and、or、union 等函数，简单的查询可以在3秒以内得出结果。即使是复杂的（例如涉及宽表与多个 BitMap 表的关联查询）且数据量大的查询，也都可以在 10 秒以内得到结果。

3）人群保存 ：

这一步将圈选的结果人群 BitMap 转换成一个明细表，然后再通过 export 语句方式，将表的数据导入 HDFS 进行输出应用。

下述是实际应用中的人群分层迁移桑基图的 SQL 示例：

对应结果图：

该 SQL 中包含了 BitMap 与普通宽表的关联操作，以及三个亿级别大表的关联操作，整体可以在5至10秒内计算完成。

#03

未来规划

更多业务场景推广落地

在公司内，我们将继续扩大和推广 StarRocks 的使用，以替换其他业务中遗留的 ClickHouse 和 Greenplum 组件，减少多组件的维护压力。同时注重在企业内部与相关数据平台的集成，提升用户使用体验，降低用户组件使用和切换成本。

上云

将 StarRocks 部署在公司的 Kubernetes 私有云中，以提高集群的扩展性和灵活性，并且可以依赖于 Kubernetes 的容错机制，自动监测和替换故障节点，提升集群可靠性和稳定性。目前，我们已经完成了开发，进行到了测试验证阶段。后续我们也将持续跟进测试 StarRocks 提供的云原生能力。

存算分离特性的使用

在离线报表应用中，我们计划测试使用即将推出的 3.x 版本。根据其存算分离的能力，在不降低查询性能的条件下，可以大大减少离线数据同步的工作量。

与社区共赢

我们将持续保持与社区的沟通，积极地将使用体验和性能测试反馈社区。通过与社区的合作，实现双赢的目标。