有没有具体的标准,比如简单的etl是怎么简单,多大数据量导致内存不足
大规模批处理有没有说法啊
亿级还是千万级,复杂ETL指的又是什么?
我们想用StarRocks取代hive, 感觉这么一说,hive不太敢动了
不知道有没有推出udf的计划,有些场景下UDF还是很有必要的
我们是支持udf的,但是现在只能用c++开发,我们近两个月会出一个新的udf框架,支持java。现在不建议您使用udf
漏斗函数会在StarRocks2.3版本发布
JAVA UDF已经在2.2发布,暂时还没有兼容Hive的UDF
场景:需要记录用户首次注册渠道,首次区服,首次登录时间
首次登录时间这种可以通过聚合表的MIN 字段聚合类型来设置,但是非时间类型字段的首次无法设置。
请问,starrocks目前是否有记录数据第一次的值这种特性?如果没有的话,能否计划未来加入这一特性?
任务多了,想要监控告警的话,有没有比较相对容易一点的做法?现在因为有很多任务,既要监控各种机器的资源,还有比如数据导入任务的情况,能在告警这一块有所考虑吗