Agent 的刹车：一文讲透 HITL（Human-in-the-Loop）

张

张建站

2026/6/18 16:18:27

10分钟阅读

Agent 正在执行一个故障排查任务。它分析完日志得出结论根因是某张表的慢查询建议立刻执行ALTER TABLE优化索引。然后它调用了工具直接在生产库上执行了。你事后才知道这件事——那张表有 2 亿条数据ALTER TABLE锁表锁了 40 分钟业务全线中断。Agent 对根因的判断可能没错但它缺少对执行风险和授权边界的判断——它不知道这个操作该不该由它来做也不知道该在什么窗口期做。这就是没有 HITL 的 Agent能干活但不知道什么时候该停下来问一句这步你确认吗。本文是「工程师的第二曲线」Agent 工程系列第07篇。编号主题状态01Agent 为什么会自己干活一文讲透 Agent Loop✅ 已发布02Context EngineeringAgent 真正的难点在这里✅ 已发布03Agent 的手一文讲透 Tool Calling✅ 已发布04Agent 的骨架一文讲透 Agent Runtime✅ 已发布05Agent 的记忆一文讲透 Memory 体系✅ 已发布06Agent 的黑匣子一文讲透 Trace 与可观测性✅ 已发布07Agent 的刹车一文讲透 HITL 本篇08给 Agent 打分一文讲透 Eval即将发布09Agent 的分工一文讲透 Multi-Agent即将发布10Agent 怎么想清楚再动手一文讲透 Planning即将发布11Agent 的外部记忆一文讲透 RAG即将发布12Agent 的行为说明书一文讲透 Prompt Engineering即将发布13Agent 的防护网一文讲透安全与 Guardrail即将发布一、为什么 Agent 需要人工介入很多人第一反应是Agent 不就是要自动化吗加人工介入不是退步了不是的。HITL 不是因为 Agent 不够聪明而是因为有些决策本来就不该由 Agent 独自做。有三类情况Agent 自己处理是有风险的操作不可逆删数据、发邮件、执行变更——做了就很难撤回。Agent 的推理再准也没有理由绕过人的确认直接执行这类操作。证据不足Agent 给出了结论但证据链不完整或者多个可能根因无法区分。这时不应只靠模型自信程度而要把不确定性暴露给人让人来判断。超出授权范围Agent 被授权做诊断但没有被授权做变更。即使它判断正确执行的权力也不在它手里。这三类情况加在一起决定了 HITL 不是可选项而是 Agent 工程化的必要组成部分。二、HITL 是什么HITLHuman-in-the-Loop就是在 Agent 执行链路的关键节点上插入人工确认或人工干预的机制。不是在每一步都等人而是在特定条件满足时暂停等人决定之后再继续。一次典型的 HITL 流程是这样的Agent 执行到某个步骤判断需要人工介入Agent 暂停把当前状态、推理依据、待执行的操作整理成摘要推送给人人看完后给出决策批准 / 拒绝 / 修改参数后继续Agent 收到决策继续执行或终止关键点在于Agent 暂停期间它的状态需要被完整保存下来——当前执行到哪一轮、已经收集了哪些 Evidence、下一步准备做什么。人批准之后Agent 要能从断点精准恢复而不是重头再跑一遍。三、什么时候触发 HITL触发 HITL 的条件需要在设计阶段就明确定义不能靠 Agent 自己感觉。常见的触发策略有三种基于操作类型对某一类工具调用强制要求人工确认不管 Agent 有多确定。比如所有写操作必须审批、“所有涉及生产环境的变更必须审批”。这是最简单也最可靠的方式。基于风险评估Agent 在调用工具前评估这次操作的风险等级——影响范围有多大、是否可逆、是否在正常操作范围内。风险超过阈值就触发 HITL低风险操作直接执行。基于不确定性信号当证据不足、工具结果互相矛盾、检索命中质量低、模型多次自我修正或模型自评置信度低时触发人工判断。这里用的是多维信号的组合而不是单靠模型自己打分——LLM 的自评置信度本身并不总是可靠的。三种策略可以组合使用。实践中通常是操作类型兜底高危操作必审批风险评估动态调整中等风险看情况不确定性信号作为辅助触发。四、工程上怎么实现HITL 看起来是个产品决策实现起来是个工程问题。难点不在于怎么弹出一个确认框而在于五件事状态持久化Agent 暂停等待人工时可能等几分钟也可能等几小时。进程不能一直挂着需要把当前执行状态序列化存下来收到人工决策后再反序列化恢复。精准 resume恢复执行时不能从头重跑要从暂停的那一步继续。这要求每一步的输入输出都有完整记录恢复时能重建出正确的上下文。审批界面人工介入的体验直接决定 HITL 的效果。摘要写得不清楚人看不懂要确认什么操作太繁琐人就倾向于无脑点批准。审批界面需要把 Agent 的推理依据、待执行操作、潜在风险清晰地呈现出来。超时与升级策略人工审批不能无限等待。需要设计超时策略超过多久自动取消、降级为只读建议还是升级给更高权限的人处理。没有超时机制的 HITL在无人响应时会让整个任务永远挂起。审批审计与 Trace 记录HITL 的价值不只是让人点按钮还要记录是谁在什么时候基于什么信息做了什么决策。每一次审批都应该写入 Trace审批人、时间、看到的摘要、批准的参数和最终执行结果都要可追溯。这和 Observability 体系是同一套基础设施。五件事做好了HITL 才是真正可用的生产系统设计。做不好要么暂停之后恢复不了要么审批流于形式要么出了问题查不清楚谁做了什么决定。五、没有 HITL 的代价没有 HITL 的 Agent在低风险任务上表现很好一旦遇到边界情况就容易出事高危操作无人把关Agent 推理正确但操作有风险没有人在执行前确认一次就是在赌 Agent 永远不会犯错。出了问题责任不清Agent 自己决策自己执行用户事后不知道 Agent 为什么这么做也没有机会介入。信任很难建立。自动化变成失控本来是为了提效结果 Agent 在不该动的地方动了手脚。自动化带来的收益被一次事故全部抵消。有了 HITL系统才有了明确边界哪些事 Agent 可以直接做哪些事必须由 Runtime 暂停并交给人确认。这不是限制 Agent 的能力而是让它在正确的范围内发挥能力。最后说一句Agent 的能力越强HITL 就越重要。不是因为不信任 Agent而是因为权力越大边界越需要清晰。一个没有刹车的车开得越快越危险一个没有 HITL 的 Agent能力越强风险越高。HITL 是 Agent 从实验玩具走向生产系统的必经之路。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】