starrocks的血缘关系解析和元数据

U_1679034554102_4883 · 2023年04月14日 07:02

【详述】基于starrocks作为数据仓库,需要解析血缘关系,但是常用的框架比如altas不支持starrocks
【背景】通过flume读取fe.audit.log,写入kafka,但是数据里面具体的sql应该如何解析呢
【数据示例】
�2023-04-13 17:34:30,265 [query] |Client=172.30.16.26:38092|User=root|AuthorizedUser=‘root’@’%’|ResourceGroup=|Catalog=default_catalog|Db=test_house|State=OK|ErrorCode=|Time=202|ScanBytes=0|ScanRows=0|ReturnRows=0|StmtId=10483|QueryId=63ea74c8-d9de-11ed-a6aa-525400f44133|IsQuery=false|feIp=172.30.16.26|Stmt=insert into dws_ac_person_score_1month_unique SELECT d1.year_month, d1.employee_id, u1.realName employee_name, d1.sum_score, d1.max_grade, d1.max_grade_last, d1.max_ac_score_id, u2.realName ac_score_name from ( SELECT employee_id, year_month, sum(score) sum_score, max(grade) max_grade, max(grade_last) max_grade_last, max(ac_score_id) max_ac_score_id FROM dwd_ac_person_score_detail_unique where employee_id is not null group by employee_id,year_month ) d1 left join dim_users_unique u1 on d1.employee_id = u1.id left join dim_users_unique u2 on d1.max_ac_score_id = u2.id|Digest=
【遇到的问题】

在java代码中我可以获取到sql语句,但是通用的解析sql,获取数据来源表和数据目标表,建立血缘关系,需要导入什么依赖;
2.如果sql语句是create建表语句,该如何解析获取元数据;
3.数据开头的�是什么东西?
【StarRocks版本】2.5.2
【集群规模】3fe（1 follower+2observer）+3be（fe与be混部）
【联系方式】392388393@qq.com

radio · 2023年10月23日 08:00

+1 的确是特别需要, 如果以starrocks直接建数仓

U_1656640941800_8368 · 2024年02月5日 09:15

你好这个业务问题你们是怎么解决的哇 @U_1679034554102_4883

whimmonkey · 2024年02月9日 09:17

有个思路是：借助于alibaba druid，解析sql成语法数来处理，目前我看已经支持到starRocks了。你可以去试试。线程的血缘分析工具,比如 sqllineage，datahub等不支持或者解析错误。

白头乌翁 · 2025年12月23日 11:03

解决了吗？怎么解决的？