导入大量数据后，查询报错

trueeyu · 2024年08月27日 11:10

不读Cache是方面，可能临时文件，不应该取一个最终文件名的名字。

motto1314 · 2024年08月27日 11:13

嗯嗯是的，当前rewrite的实现逻辑是：

write阶段：

commit阶段（apply进行rewrite）：

大佬你微信是？

trueeyu · 2024年08月27日 11:14

还有就是，不应该在ScalarColumnIterator里重置这个use_page_cache

trueeyu · 2024年08月27日 11:14

trueeyu · 2024年08月27日 11:29

感谢 @motto1314 @wtai 问题原因已确定，Fix方法还在讨论

cmptmn · 2024年08月28日 01:52

原来如此，使用了具有脏数据的索引去读数据导致了page的定位错误，读出的page进行checksum校验当然不匹配了。看来page_cache潜在很大的风险呀！怎么保证其它地方不会缓存了脏数据？

motto1314 · 2024年09月3日 03:53

page_cache缓存的正常都是正确的，不会存在脏数据。
sr的机制，数据文件本身写完不会被改变的，正常情况都不会存在脏数据的。

tomsong · 2024年10月28日 12:04

请问：3.2.9存算分离场景出现Bad page: checksum mismatch 也是类似的问题吗