继续沿着相关主题看下去,会更容易把概念和工程实现串起来。
Retrieve -> Score -> Rerank -> Keep Top Results
RAG 重排 Rerank
展示召回结果为什么还要重排,以及最终真正送进模型的片段通常只有少数几条。
打开演示 Vector Similarity >= Threshold ?
Embedding 相似度阈值
通过相似度阈值控制展示为什么“有点像”不等于应该被采纳。
打开演示 Query -> Retrieve -> Rerank -> Context -> Generate
RAG 检索增强生成
演示查询改写、召回、重排、拼接上下文与最终生成的完整流程。
打开演示