推理模型
Reasoning Model具备扩展思考能力的 LLM,通过「慢思考」链式推理解决数学、代码等复杂问题,代表作有 o1/o3、DeepSeek-R1、Claude 3.7 Sonnet。
# 推理
# LLM
推理模型
推理模型在给出最终答案前会进行大量内部「思考」,通过自我验证和回溯提升准确率。
与普通 LLM 的区别:
| 标准 LLM | 推理模型 | |
|---|---|---|
| 思考过程 | 隐式(CoT 提示) | 显式内部思考链 |
| 擅长场景 | 通用问答、创作 | 数学、代码、逻辑推理 |
| 响应延迟 | 低 | 高(思考时间更长) |
| Token 消耗 | 低 | 高 |
代表模型: - OpenAI o1 / o3(全面推理) - DeepSeek-R1(开源,接近 o1 水平) - Claude 3.7 Sonnet(Extended Thinking 模式)
提示: 对于简单问题,推理模型反而可能过度思考——按任务复杂度选型。