StarRocks导出数据数据运行过程中中断

zhanglib · 2023年11月16日 06:51

【详述】通过ETL工具将StarRocks数据导入关系型数据库，运行过程中报错Couldn’t get row from result set
【背景】通过ETL工具将StarRocks数据导入关系型数据库
【业务影响】
【StarRocks版本】3.0.7
【集群规模】3fe（3 follower）+4be（fe与be分开部署）
【机器信息】54G/万兆
现象：

查看FE日志：

BE日志：

修改会话参数pipeline_dop=2。还是报错

llppff · 2023年11月16日 07:13

使用的什么ETL工具？通过什么方式从StarRocks读取数据的？ETL工具的日志里有StarRocks返回的报错信息吗

zhanglib · 2023年11月16日 10:59

Kettle，通过select 语句查询导出，报错信息就是上面现象中的错误

llppff · 2023年11月16日 11:09

select语句可以发下吗

zhanglib · 2023年11月16日 11:12

SELECT
/*+ SET_VAR(query_timeout = 28800,pipeline_dop=2) */
xxx, xxx, … 50个字段
FROM xxxx
where LastTime <DATE_FORMAT(DATE_SUB(CURDATE(), INTERVAL 30 DAY),’%Y%m%d’)

liuhangyuan · 2023年11月16日 11:27

LastTime字段上有过滤的优化吗？或者你不用ETL工具，就直接拿这条sql，看看能查询出来吗？目前看状态应该是查询性能不太行

zhanglib · 2023年11月16日 11:29

直接查很快，2000多万数据，3分钟就查询出来

zhanglib · 2023年11月16日 11:30

应该是内部缓存到BE节点了，Kettle慢慢拉取，拉取过程中报错，就是我截图的那些错误

zhanglib · 2023年11月16日 11:32

查看FE审计日志，其实查询早就结束了，用了三分钟，但是etl用了一个多小时，后面就报报错

liuhangyuan · 2023年11月16日 11:41

正常查询的时候，pipeline_dop也是2吗

zhanglib · 2023年11月16日 11:42

pipeline_dop=0，后来加的2，现在无论是几都会报错

许秀不许秀 · 2023年11月16日 12:23

先重启下BE，这个brpc overflow 应该是传输了超大的包导致的

许秀不许秀 · 2023年11月16日 12:24

这个brpc overflow你们是怎么复现的

zhanglib · 2023年11月16日 12:24

怎么找到具体传的是什么呢？这是个bug吗？

zhanglib · 2023年11月16日 12:25

不用复现啊，现在导出数据就报这个错误

许秀不许秀 · 2023年11月16日 12:25

只要是导出就会报这个问题吗？

zhanglib · 2023年11月16日 12:25

小数据量的可以，大数据量的不行

许秀不许秀 · 2023年11月16日 12:26

select max(length()) from xxx; 把各个字段长度获取下？

zhanglib · 2023年11月16日 12:26

看数据量，一千万应该没有问题，再多了就用风险

zhanglib · 2023年11月16日 12:26

整个表大概2G，45个字段