在提示工程的浪潮中如何让大语言模型LLM不仅会“说”更会“做”正成为研究者与开发者关注的核心课题。传统的 Chain of ThoughtCoT强化了模型的推理链条Tree of ThoughtsToT则让模型具备多路径探索能力而 ReActReason Act 的出现更像一次范式升级——它让模型拥有了“思考-执行-反馈”的循环能力能够 调用工具、检索信息、执行任务迈向自主智能体Autonomous Agent的未来。一、认识ReActReason Act提示词技术在各种提示词工程技术中ReActReason Act正成为新兴的重要方法论。它由Reason推理和Act行动两部分组成其核心理念是让模型先进行可解释的推理Reason再根据推理结果选择并执行动作Act从而突破 LLM 仅能“就题论题”的局限使其能够主动探索、调用外部工具、检索信息甚至多轮规划。如果说Chain of ThoughtCoT让模型能“边想边说”Tree of ThoughtsToT让模型能“多路分支思考”那么ReAct则赋予模型“思考后去做”的能力让 AI 不仅停留在纸面逻辑而是具备“计划-行动-反馈”的闭环能力。这一技术正在推动自主代理Autonomous Agent的发展比如 AutoGPT、LangChain Agent 等框架都不同程度地融合了 ReAct 思想。人类解决需要外部信息的问题时会遵循这样的逻辑推理我需要知道 A 信息但我不知道所以得查一下行动打开搜索引擎搜索 A 信息反馈看到搜索结果后发现还需要 B 信息继续搜索循环直到收集足够信息最终解决问题。ReAct 技术的设计思想非常简洁Reason推理让模型解释它对任务的理解、思考过程或下一步打算。Act行动模型基于推理结果执行一个明确动作例如调用 API、搜索数据库、生成代码片段、写出部分结果。Observation观察记录动作的反馈或结果作为新的信息输入给模型。Loop循环基于新的信息模型再次 Reason → Act直到任务完成。这个循环过程让模型不再只是“一次性给答案”而是像人类解题或办事时一样不断试错、调整、再尝试。ReActReason ActToTTree of Thoughts理念将推理Reason和行动Act结合模型先思考再执行动作并根据结果迭代让模型多路径探索生成树状推理分支通过“修剪”选择最优路径结构Reason → Act → Observation的循环像“边想边做”分支推理每个节点分化出多个方案再逐步筛选目标赋予模型执行力可调用工具、搜索、写代码、下指令赋予模型更强的多路径思考能力避免单一路径偏误任务✅ 任务执行型信息检索、代码调试、工具调用、API 工作流✅ AI Agent 场景需要主动执行操作的系统✅ 复杂思考型活动策划、多条件推理、逻辑谜题✅ 创意生成故事多结局设计、产品功能组合步骤1️⃣ Reason推理→ 2️⃣ Act执行动作→ 3️⃣ Observation观察结果→ 4️⃣ 迭代1️⃣ 问题分解 → 2️⃣ 多分支思考 → 3️⃣ 评估每个分支 → 4️⃣ 修剪无效路径优势 能连接外部世界搜索、API、数据库 减少幻觉通过行动验证信息 能形成“智能体”闭环 多路径探索避免“一条路走错” 创意组合更丰富可融合不同分支 适合复杂推理和规划劣势⚠️ 设计复杂需定义 Reason/Act 边界⚠️ 每一步调用消耗 token 成本高⚠️ 工具安全与权限管理需注意⚠️ 生成分支多计算开销大⚠️ 需要人工或系统设计“修剪规则”⚠️ 结果整合难度高特点动态输出随行动反馈更新可见思路链条 执行动作记录多分支结果对比可生成多套方案或最佳解应用AutoGPT、LangChain Agent、网页搜索助手、AI 编程助理复杂数学题推理、游戏剧情多线设计、企业战略规划ReAct 更像一位“执行者”—— 它能一边推理、一边调用工具、搜索信息或下达指令适合任务驱动型场景比如 AI 助手写代码、自动化工作流。你现在是一位 ReAct 智能体负责为一家书店设计 9 月的促销活动。 请按照 Reason → Act → Observation 的循环进行思考和执行。 目标 - 提升线下书店的到店客流 - 提高每位顾客的平均消费金额客单价 - 预算有限活动需具有创意和吸引力 步骤 1. Reason推理分析 9 月书店促销的市场趋势、消费者偏好和竞争对手做法。 2. Act行动如果需要请模拟执行这些动作 - [搜索] 查询 9 月适合书店的活动灵感如开学季、文学节 - [列清单] 提供 5 个可操作的活动点子 - [分析] 比较每个点子的优势和风险 3. Observation观察总结行动得到的信息并继续下一步推理。 4. 最终输出给出一个完整的书店 9 月促销活动方案包含活动主题、主要环节、成本考虑和执行建议。ToT 更像一位“思想家”—— 它不急于执行而是先在多条路径中展开思考、修剪错误分支最终形成更全面、稳健的结论适合创意生成与复杂规划任务。你是一名创意策划专家请用 Tree of Thoughts思维树的方法为书店设计一场 9 月的促销活动。 请分阶段完成任务并在每个阶段清楚标注输出。 【阶段 1分支发散】 - 先提出至少 3 条不同的促销主线例如产品优惠、体验活动、社交传播。 - 每条主线下再细分出 2-3 个具体创意。 【阶段 2优劣分析】 - 对每个子创意进行优势与风险分析例如成本高低、是否能吸引新客、是否能提升客单价。 【阶段 3修剪与保留】 - 删除缺乏吸引力或风险过高的创意保留最有潜力的方案。 【阶段 4方案组合】 - 将保留下来的创意融合形成 1 个完整的“书店 9 月促销活动”方案包括 - 活动主题 - 核心创意环节 - 成本与执行建议由于 ReAct 的核心是将推理Reason与行动Act结合让模型在思考过程中能主动调用外部工具或执行具体操作。在代码生成场景中这意味着模型不仅能写出代码还能在遇到疑问时先分析问题、再执行“查询文档”“调用调试工具”“运行测试”等步骤从而形成更像开发者的工作流。这种方式极大提升了代码生成的准确性与实用性。例如在构建一个 Python API 时模型可以先 Reason推理 API 的需求和参数再 Act查询官方文档或调用已有模块最后基于 Observation观察执行结果继续修改代码。这种循环让代码更贴近真实开发流程避免“凭空输出”导致的错误或不完整实现。因此ReAct 已经成为AI 编程助手、LangChain Agent、AutoGPT等系统的核心框架。相比于单纯“生成代码”的提示方式ReAct 能让模型像一个带有逻辑链条的“虚拟程序员”具备分析—执行—验证的能力更适合涉及多步骤调试、依赖库调用、API 集成等复杂编程任务。用 ReAct 解决 实时信息查询 问题以 计算 Metallica 乐队成员共有多少个孩子 为例需要实时数据且成员信息可能随时间变化解析 ReAct 的执行过程。任务与工具准备任务计算 Metallica 乐队成员的孩子总数工具LangChain 框架用于构建 Agent、VertexAILLM、SerpAPI搜索引擎 API获取实时信息核心逻辑LLM 无法记住每位成员的家庭情况需通过搜索逐个获取信息再汇总计算。代码实现核心片段from langchain.agents import load_tools from langchain.agents import initialize_agent from langchain.agents import AgentType from langchain.llms import VertexAI # 定义问题 prompt How many kids do the band members of Metallica have? # 初始化LLM温度设为0.1减少随机性 llm VertexAI(temperature0.1) # 加载工具此处用SerpAPI进行搜索 tools load_tools([serpapi], llmllm) # 初始化ReAct Agent agent initialize_agent( tools, llm, agentAgentType.ZERO_SHOT_REACT_DESCRIPTION, # ReAct模式 verboseTrue # 显示推理过程 ) # 执行任务 agent.run(prompt)执行过程解析ReAct 循环第一步推理→确定行动方向Thought: Metallica has 4 members. I need to find out how many kids each member has and sum them up.Action: SearchAction Input: How many kids does James Hetfield have?推理已知乐队有 4 名成员需逐个查询孩子数量行动先搜索主唱 James Hetfield 的孩子数量第二步观察→获取信息并更新推理Observation: James Hetfield has three children.Thought: 1/4 Metallica band members have 3 children. Next, I need to check Lars Ulrich.Action: SearchAction Input: How many kids does Lars Ulrich have?观察James 有 3 个孩子推理已完成 1/4下一步查鼓手 Lars Ulrich第三步循环→继续获取剩余信息Observation: Lars Ulrich has 3 children.Thought: 2/4 members have 6 children total. Now check Kirk Hammett.Action: SearchAction Input: How many kids does Kirk Hammett have?Observation: Kirk Hammett has two sons, Angel and Vincenzo.Thought: 3/4 members have 8 children total. Finally, check Robert Trujillo.Action: SearchAction Input: How many kids does Robert Trujillo have?Observation: Robert Trujillo has 2 children.Thought: 4/4 members have 10 children total.循环依次查询吉他手 Kirk 和贝斯手 Robert累计数量第四步输出最终结论Final Answer: 10核心价值通过 推理 - 行动 - 反馈 循环LLM 无需记忆实时数据而是通过工具动态获取解决了 知识过时 的问题。二、Step-back、思维树ToT与 ReAct 三种技术属性Step-backToT思维树ReAct推理 行动核心策略先抽象通用原则再解决具体问题多路径推理评估并修剪分支推理 行动 反馈循环解决的核心问题输出泛化性差、细节单薄单一路径推理易出错复杂任务适配差知识过时、无法获取外部信息典型工具 / 依赖无纯提示词无纯提示词依赖外部工具搜索引擎、API调用、数据库等代表场景创意生成、知识讲解、决策支持规划类任务、逻辑谜题、多结局故事设计实时信息查询、复杂工具操作、多步骤外部交互推理结构两步先抽象再具体树状多分支循环式推理与行动错误容忍度中等依赖通用知识增强准确性高错误路径可被修剪高实时修正基于反馈输出多样性低通常产生单一答案高多路径并行探索适中根据反馈调整行动与推理复杂任务适应性中适合知识迁移和复杂概念拆解高适合多步骤、多方案问题高适合动态环境及实时反馈任务计算资源需求低中至高多路径并行评估中依赖工具调用和循环交互对提示设计要求需精心设计通用问题与具体任务衔接需设计多个分支示例兼顾路径多样性需设计动作调用和反馈机制提示人机交互特性透明度高用户可看到中间通用知识提取结果透明度中等用户可看到路径分支但复杂交互性强模型主动请求外部信息或执行动作典型应用案例游戏剧情设计、广告文案撰写、教学辅助数学题解、规划决策、故事多结局设计AI助手、智能客服、自动化编程助手同一个任务「为一家独立书店设计夏季营销活动」分别写出Step-back、ToT、ReAct三种方法的提示词示例便于直观对比。当然这里我用同一个任务「为一家独立书店设计夏季营销活动」分别写出Step-back、ToT、ReAct三种方法的提示词示例便于直观对比。Step-back 提示词示例先让模型抽象出通用原则再基于这些原则生成方案。你是一名营销策划专家。 第一步请总结在“书店”这一业态中夏季营销活动常见的5个有效策略或通用原则例如顾客心理、活动形式、合作资源。 第二步请基于上述原则为一家独立书店设计一个夏季营销活动方案目标是 - 吸引更多年轻顾客 - 提高到店转化率 - 控制预算在2万元以内 请输出完整方案并标注每个环节对应的原则。ToT思维树提示词示例 让模型分支思考多条路径并在过程中进行修剪。你是一名资深品牌策划顾问请使用“思维树Tree of Thoughts”推理方式为一家独立书店设计夏季营销活动。 【步骤 1目标设定】明确书店的营销目标①拉新顾客 ②提高客单价 ③保持预算可控。 【步骤 2多路径发散】 - 分支1以“产品组合”为核心的方案如书籍套餐、会员卡优惠 - 分支2以“体验升级”为核心的方案如主题活动、签售、工作坊 - 分支3以“社交传播”为核心的方案如社交媒体打卡、赠品互动 【步骤 3方案细化】为每条分支列出至少2个子创意并简要说明优势与潜在风险。 【步骤 4修剪与组合】去掉不适合的创意最终组合成一个最优营销方案并解释为什么选择这些元素。ReAct 提示词示例让模型结合推理 工具调用假设模型可以访问搜索引擎或数据库。你是一名市场营销顾问采用 ReActReason Act方法为一家独立书店设计夏季营销活动。 【Reason推理】 1. 分析夏季书店顾客的消费趋势与偏好。 2. 推测哪些活动可能吸引目标客群年轻人和学生。 【Act行动】 1. 先调用搜索工具SEARCH查询最近在北京/上海地区独立书店举办的夏季活动案例近3个月。 2. 调用价格数据库API查询印制500份定制书签和环保帆布袋的大致成本。 【Reason反馈推理】 - 结合实时搜索结果与成本数据调整活动创意确保预算可控。 【最终输出】 - 一份详细的夏季营销方案包括创意主题、执行步骤、预算估算并说明搜索和数据结果如何影响了决策。随着 AI 系统逐渐从“被动应答者”演进为“主动执行者”ReAct 及其背后的提示词设计理念正在改写人机交互的边界。无论是实时信息查询、复杂任务执行还是智能代理AI Agent开发ReAct 都提供了新的方法论基座。而与 Step-back 和 ToT 协同使用时这三种技术能够 互补长短Step-back 负责搭建抽象框架ToT 提供多路径推理ReAct 则最终 将思考落地为行动。这意味着提示工程的未来将不仅是“更聪明的问答”而是“更有执行力的智能”。