● ReAct vs Plan-and-Execute 详细对比 核心思想

张开发
2026/4/4 7:39:00 15 分钟阅读
● ReAct vs Plan-and-Execute 详细对比 核心思想
一、核心思想维度ReActPlan-and-Execute全称Reasoning ActingPlan-and-Execute (也叫 Plan-then-Execute)范式交替进行推理和行动, 逐步决策先生成完整计划, 再逐步执行类比边走边看的导航先看地图规划路线, 再出发二、工作流程对比ReAct 循环Thought - Action - Observation - Thought - Action - Observation - ... - Final Answer每一步都根据上一步的观察结果, 重新推理下一步该做什么。没有全局计划, 完全是增量式决策。Plan-and-Execute 循环阶段1: Input - Planner LLM - [Step1, Step2, Step3, ...] 阶段2: Step1 - Executor - Result1 Step2 - Executor - Result2 (可根据 Result1 调整) ... 阶段3: Results - Final Answer先由 Planner 生成结构化计划, 再由 Executor 逐步执行。执行过程中可选择性地 replan。三、多维度对比3.1 推理能力维度ReActPlan-and-Execute全局规划弱。缺乏前瞻性, 易陷入局部最优强。先全局思考再行动适应性强。每步都可根据新信息调整中等。需要显式 replan 机制推理深度浅到中。每步推理负担小计划阶段深, 执行阶段浅3.2 Token 效率维度ReActPlan-and-Execute上下文消耗高。每步都携带完整历史低。Executor 只需当前步骤必要上下文总 token 量随步数线性增长(累积 context)计划阶段固定 执行阶段可控长任务表现差。容易撞 context window 上限好。天然支持长链任务这是 Plan-and-Execute 的最大优势之一: Executor 不需要看到所有历史, 只需要当前子任务的描述和必要输入。3.3 错误处理维度ReActPlan-and-Execute错误恢复自然。下一步 Thought 可以反思错误需要 replan 机制, 否则会盲目执行错误计划错误传播低。每步独立决策高。计划错误会连锁影响后续步骤幻觉风险中。每步都有观察校正计划阶段较高(没有外部验证)3.4 任务适用性任务类型更适合原因简单问答 / 单步检索ReAct计划开销不值得探索性任务(不确定需要几步)ReAct无法提前规划多步确定性任务(数据管道、报告生成)Plan-and-Execute步骤可预见, 计划价值高长链任务(10 步)Plan-and-Executetoken 效率优势明显需要并行执行的任务Plan-and-Execute计划可识别独立子任务并行化交互式调试ReAct需要高频反馈循环3.5 工程实现维度ReActPlan-and-Execute实现复杂度低。单一 prompt loop中高。需要 Planner Executor (可选) Replanner可观测性中。Thought 链可读但冗长高。计划本身就是可审计的结构可控性低。难以干预中间决策高。可以在执行前审核/修改计划模型要求需要较强的逐步推理能力Planner 需强规划能力, Executor 可用较弱模型四、混合架构(实践中最常见)实际生产系统很少纯用一种, 常见的混合方式:--------------------------------------------------- | Plan-and-Execute 外层 || | | Planner - [Task1, Task2, Task3, ...] || | | ------------------------------------------- | | | 每个 Task 内部用 ReAct 执行 | | | | Thought - Action - Observation | | | | - Thought - Action - ... | | | ------------------------------------------- | | | | 执行完一个 Task 后 - Replanner 评估 | - 调整后续计划 - 继续执行 | ---------------------------------------------------典型代表: LangGraph 的 Plan-and-Execute 模板、AutoGPT 后期版本。五、选择决策树任务步骤 3 步? -- 是 -- ReAct (计划开销不值得) -- 否 -- 任务步骤可预见? -- 是 -- Plan-and-Execute -- 否 -- ReAct 或 混合架构 需要人工审核中间计划? -- 是 -- Plan-and-Execute (计划天然可审计) 上下文窗口紧张? -- 是 -- Plan-and-Execute (token 效率高) 任务高度不确定、需要频繁试错? -- 是 -- ReAct六、总结结论说明ReAct 优势灵活、简单、适应性强, 适合探索性和短链任务PE 优势高效、可控、可审计, 适合确定性和长链任务生产环境推荐混合架构 -- 用 PE 做顶层编排, ReAct 做子任务执行, 加 replan

更多文章