UDAF--版本从2.3.2升级到2.3.4 或者2.4后线上运行的UDAF运行异常

U_1656640941800_8368 · 2022年12月20日 01:43

【详述】版本从2.3.2升级到2.3.4 或者2.4后线上运行的UDAF运行异常
文件是min_by的java实现
MinBy2.java (2.0 KB)

Natsume729 · 2022年12月20日 08:43

麻烦贴下报错信息和相关的错误截图，谢谢！

U_1656640941800_8368 · 2022年12月20日 09:23

和这个差不多这是另外一个聚合函数的 min_by是63行报错

Natsume729 · 2022年12月20日 09:44

2.3.2的时候是可以运行的对吧

U_1656640941800_8368 · 2022年12月20日 10:43

是的线上是2.3.2 是正常运行的

Natsume729 · 2022年12月20日 11:13

能简化下最小的复现场景么。比如建表和查询调用函数的sql，我们复现下

Natsume729 · 2022年12月20日 11:19

把min_by那个merge里面 <= 去了试试，应该是写的不对。低版本是恰好撞上去了，可以运行

U_1656640941800_8368 · 2022年12月21日 02:22

那是我们的业务处理逻辑是必须的判断

U_1656640941800_8368 · 2022年12月22日 06:03

集群环境数据量足够大任何表都行；
sql: select min_by({vachar_column},{long_column}) from table 就可以

Natsume729 · 2022年12月23日 02:10

这个是UDF写的问题，得改UDF，参考一下我们提供的example，之前用的<=是不规范的。

U_1656640941800_8368 · 2022年12月23日 02:34

这个函数的业务就是根据第二个值的最小值，返回对应的第一个值； long类型的比较用<= 不规范指的是什么，可以说明下吗谢谢！样例(文档是提供的样例)中没有看到做比较的逻辑

kun_153 · 2023年01月4日 03:47

我们也碰到了类似问题
看了回复。同样不是很理解这里的<=判断不规范是指什么？可以具体说一下嘛
这里只是业务逻辑的判断吧，通过比较 buffer 中的bufftime 和原 state 中的time 值，来判断是否要更新后面的取值。

kun_153 · 2023年01月4日 03:48

我们在预研starrocks，2.3.2 的版本中出现了跑udaf 导致be崩溃的问题，看问题在2.4.2 中解决了。但是升级后出现了这篇同样的问题。麻烦帮忙看一下吧

许秀不许秀 · 2023年01月4日 12:42

所有序列化之后的值，在反序列化阶段都需要读出来。比如我某条记录序列化的时候写了10byte，那么我发序列化的时候必须读10byte，否则剩下的内容就会被下一条数据读取

U_1656640941800_8368 · 2023年01月5日 02:31

按照您的提示我们测试下哈虽然还是有疑问

U_1656640941800_8368 · 2023年02月15日 06:56

已经按照你说的做了代码修改：

但是其中输出的日志不太明白：

1.同一查询State#serializeLength()返回值是固定的–本例中是44, 为什么会出现capacity成倍上涨的情况呢
2. 对于这种State#serializeLength()返回值是固定的的逻辑，还可以获取buffer中的有效值，但是对于漏斗这种逻辑，怎么实现从buffer中获取有效值呢
3. 104行有 buffer.capacity() == buffer.position()的判断，因为在之前的测试中有发现，会有传入的buffer中有buffer.capacity() == buffer.position()的情况