为了更快的定位您的问题,请提供以下信息,谢谢
【详述】StarRocks FE 后台守护线程 TaskRunStateSynchronizer 周期性(每 5 秒)抛出 NullPointerException,导致 FE 无法建立新连接,但进程和端口仍处于活跃状态。
【背景】
【业务影响】
【是否存算分离】否
【StarRocks版本】 3.3.13
【集群规模】例如:3fe+2be(fe与be独立节点)
【机器信息】fe 16c 32G. be 32c 96G
【联系方式】liji9988@yeah.net
【附件】
2. 错误日志信息
2.1 错误堆栈
ERROR (TaskRunStateSynchronizer|216) [Daemon.run():111] daemon thread got exception. name: TaskRunStateSynchronizer
java.lang.NullPointerException: null
at com.starrocks.scheduler.TaskRun.getStatus(TaskRun.java:329)
at com.starrocks.leader.TaskRunStateSynchronizer.runAfterCatalogReady(TaskRunStateSynchronizer.java:57)
at com.starrocks.common.util.FrontendDaemon.runOneCycle(FrontendDaemon.java:72)
at com.starrocks.common.util.Daemon.run(Daemon.java:109)
2.2 错误发生时间线
-
首次出现: 2025-12-15 09:59:51.659+08:00
-
持续频率: 每 5 秒一次(符合
TaskRunStateSynchronizer的调度间隔) -
最后出现: 2025-12-15 14:05:03.119+08:00
-
持续时间: 约 4 小时 5 分钟
-
错误总数: 约 3000+ 次(根据日志统计)
2.3 相关任务信息
从日志中观察到以下任务频繁初始化:
2025-12-15 00:52:55.054+08:00 INFO (leaderCheckpointer|204) [TaskRun.initStatus():365] init task status, task:mv-35129752, query_id:b45c0f79-ae64-11f0-931f-00505691212e, create_time:1761040799438
2025-12-15 00:52:55.054+08:00 INFO (leaderCheckpointer|204) [TaskRun.initStatus():365] init task status, task:mv-35129752, query_id:b45c84ae-ae64-11f0-931f-00505691212e, create_time:1761040799441
...
2025-12-15 04:50:06.974+08:00 INFO (leaderCheckpointer|204) [TaskRun.initStatus():365] init task status, task:mv-35129752, ...
2025-12-15 07:28:18.632+08:00 INFO (leaderCheckpointer|204) [TaskRun.initStatus():365] init task status, task:mv-35129752, ...
关键发现:
-
mv-35129752任务在日志中反复初始化,但在当前SHOW MATERIALIZED VIEWS查询结果中不存在 -
该任务疑似为"孤儿任务"(MV 已被删除或迁移,但 TaskRun 元数据残留)
-
其他相关任务:
mv-138078(DIM_CHANNEL_MV),mv-141071(DIM_GOODS_MV)fe.warn.log.20251215-1 (22.1 MB)
