跳到主要内容
RAG Rerank

RAG 重排 Rerank

初始召回只是候选集合。真正进模型的上下文,通常还会经过相关性打分、重排和截断。

RAG Rerank
返回原理演示
查看产品

用户问题

合同续签审批需要哪些材料?
1. 初始召回
2. 重排打分
3. 送入模型

候选文档

文档 A:合同审批制度总览

Vector 0.81

已召回

文档 B:合同续签材料清单

Vector 0.78

已召回

文档 C:法务审核补充要求

Vector 0.71

已召回

文档 D:请假审批流程

Vector 0.73

已召回

文档 E:原合同归档说明

Vector 0.69

已召回

最终上下文

文档 B:合同续签材料清单

0.97

已丢弃

文档 C:法务审核补充要求

0.88

已丢弃

文档 E:原合同归档说明

0.83

已丢弃

推荐下一步

推荐下一步

继续沿着相关主题看下去,会更容易把概念和工程实现串起来。

Query -> Retrieve -> Rerank -> Context -> Generate

RAG 检索增强生成

演示查询改写、召回、重排、拼接上下文与最终生成的完整流程。

打开演示
Vector Similarity >= Threshold ?

Embedding 相似度阈值

通过相似度阈值控制展示为什么“有点像”不等于应该被采纳。

打开演示
Document -> Chunk -> Embed -> Retrieve

RAG 分块 Chunking 演示

对比大块、适中、小块切分对召回命中的影响,理解为什么 chunk 大小会改变答案质量。

打开演示