跳到主要内容
RAG Chunking

RAG 分块 Chunking 演示

文档切块不是越大越好,也不是越小越好。分块粒度会直接影响召回是否命中关键信息。

RAG Chunking
返回原理演示
查看产品

查询:合同续签审批需要哪些材料?

合同续签审批流程
续签申请需要业务说明与绩效记录
法务复核后进入负责人审批
归档时补充原合同与续签说明
召回结果91%

推荐下一步

推荐下一步

继续沿着相关主题看下去,会更容易把概念和工程实现串起来。

Retrieve -> Score -> Rerank -> Keep Top Results

RAG 重排 Rerank

展示召回结果为什么还要重排,以及最终真正送进模型的片段通常只有少数几条。

打开演示
Vector Similarity >= Threshold ?

Embedding 相似度阈值

通过相似度阈值控制展示为什么“有点像”不等于应该被采纳。

打开演示
Query -> Retrieve -> Rerank -> Context -> Generate

RAG 检索增强生成

演示查询改写、召回、重排、拼接上下文与最终生成的完整流程。

打开演示