跳到主要内容
Model Routing

模型路由

平台不会把所有请求都发给同一个模型,而是根据任务难度、速度和成本要求做分发。

Model Routing
返回原理演示
查看产品

任务类型

路由策略

Selected Route

高质量推理模型

任务复杂或价值高,平台会倾向更强的推理能力。

成本

42

速度

48

质量

95

推荐下一步

推荐下一步

继续沿着相关主题看下去,会更容易把概念和工程实现串起来。

Prompt -> Schema Match -> JSON Arguments

Function Calling / JSON 输出

展示模型如何把自然语言请求转成结构化参数,而不是只返回一段描述文字。

打开演示
Task -> Tool -> Result -> Next Action

Agent 工具调用演示

展示 Agent 如何理解任务、挑选工具、读取结果并决定下一步,而不是一次性给答案。

打开演示
Low Temp -> Stable | High Temp -> Diverse

Temperature 温度演示

用同一个问题对比低温和高温采样,理解模型为什么会更稳或更发散。

打开演示