为了更快的定位您的问题,请提供以下信息,谢谢
【详述】
1.使用hnsw索引算法时efsearch的参数未生效,经测试,未能对精度和性能产生符合理论规律的影响
2.使用ivfpq索引算法时,nprobe与range_search_confidence参数未生效,经测试,未能对精度和性能产生符合理论规律的影响
【StarRocks版本】main分支
【集群规模】1fe + 1be
【机器信息】CPU64核 + 内存1000GB
- range_search_confidence参数,范围搜索置信度(默认为0.1)⽤于描述近似范围搜索的精度,范围 [0,1],值为1时最准确;但实际测试对精度没有影响。
- efsearch⽤于控制搜索过程中的精度-速度权衡,默认值为16;efSearch 的值越⼤,搜索过程就越精确,但速度可能会变慢;反之,efSearch 的值越⼩,搜索速度就越快,但可能会牺牲⼀些精度。
在具体的测试之中,ef_search参数对精度和速度没有影响。
查询命令为:
select /*+ SET_VAR (ann_params=’{{nprobe=1,max_codes=0,scan_table_threshold=0,polysemous_ht=0,range_search_confidence=0.1}}’) */ id, approx_cosine_similarity([0.011737499386072159,-0.09795854985713959,…], vector1) as score from starrocks.knowledgeqa_1000q32_9 order by approx_cosine_similarity([0.011737499386072159,-0.09795854985713959,…], vector1) DESC limit 1;