【详述】StarRocks文档提供的Grafana监控模板对于低版本Grafana不适配踩坑记录与解决方案,Grafana-5.3.4
【背景】想要基于文档建立starrocks监控体系,采用了1.9/2.3提供的两个模板进行了测试,通过prometheus进行数据导出后发现仍然存在许多的问题,因此根据grafana提供的模板json进行了解析,发现了部分问题
【业务影响】导致部分监控指标与实际不一致问题
【StarRocks版本】2.3(测试)&1.9(生产)
【集群规模】2fe+3be混部(测试)&5fe+10be混部(生产)
【踩坑&解决过程(由于在家,无法访问内网,所以不贴出具体图片)】
-
问题: grafana导入prometheus后,部分面板数据空/出错,通过edit进入面板配置后发现面板datasource为default,而不是指定数据源
1.1 原因: grafana模板中部分面板datasource直接指定为default,而不是${StarRocks_Prometheus}
1.2 解决方案: 将default替换为${StarRocks_Prometheus},注意需要重新导入json过程中修改,而不是直接在grafana面板的panel json中修改,否则会直接指定为${StarRocks_Prometheus}原字符串,不会替换 -
问题: 5.3.4版本Grafana无法进行筛选,需要重新根据json对应的表达式重新配置Variables,否则只会出现demo相关文字
-
问题: 版本不适配问题,5.3.4版本Grafana没有stat以及table-old,部分面板需要将stat修改为singlestat与table-old修改为table(注意,只针对面板类型,而不是表达式)
-
问题: grafana向prometheus发送查询表达式时,比如fe_master=127.0.0.1,会被转义为fe_master=127\.0\.0\.1,这时需要在=后面加上~进行非转义才不会导致数据为空newGrafanaDashboard.json (214.7 KB)
【附件】