一、AI Coding 现状与痛点为什么需要 Harness得物离线数仓各小组已基本完成 AI Coding 工具的覆盖主力工具为 Claude Code辅以数据平台的 IDE 插件应对重复性工作时效率提升明显。但团队在实际使用中暴露出三类结构性痛点。痛点一AI 不记得上下文约束开发过程中反复失忆这是 Claude Code 的 context compact 机制的系统性限制。痛点二规范执行不稳定靠记忆兜底的部分最容易出问题人工和 AI 的规范遵守率都不高。痛点三大型需求开发中context 很快被撑满越到后期 AI 越不可靠。针对这些痛点Harness 工程的目标是把执行层的不稳定因素系统性地消掉。二、先搞清楚Harness是什么Harness Claude Code 的宿主运行框架即 Claude Code 客户端本身这个工具链容器。它管理 context window 生命周期在 LLM 推理循环之外确定性地执行 hooks协调 subagents 的生命周期不依赖模型判断直接执行配置的自动化行为。三、核心问题compact 到底丢掉什么每次数仓开发 context 接近满时auto-compact 触发会把整个对话历史替换为一份摘要token 缩减到原来的约 12%。数仓场景中对话中的约束、SKILL 文件内容、自测结果等在 compact 后容易丢失。四、五层防御体系从简单到复杂第一层写死进 CLAUDE.md将当前迭代的关键信息写入每次 compact 后从磁盘重新注入。第二层Auto Memory 自动积累Claude 自动将跨会话发现写入 ~/.claude/projects//memory/MEMORY.md每次 compact 后重新注入。第三层hooks 自动验证是解决每次写完 SQL 自动检查的关键机制包含配置文件位置、settings.json 完整配置、SQL 规范自动检查脚本、危险 DDL 拦截脚本等。第四层subagents 做上下文隔离把高 token 消耗但结果只需要摘要的操作放到 subagent 的独立 context 中执行。第五层SKILL 文件改造把 SKILL 文件的执行步骤提炼成 subagent 指令主 context 只接收结果摘要。五、可行落地方案数仓 Harness 架构整体架构设计的核心逻辑是职责分层持久化层解决失忆问题Harness 层Hooks解决规范靠记忆的问题Subagent 层解决context 被撑满的问题。数仓的研发流程可按对 context 的影响分成两类不同步骤以最合适的方式运行。六、基于 SKILL 规范的数仓工作流设计数仓 8 步 SKILL 规范天然对应 Harness 的三层机制核心思路是主对话只读规范结论实际执行由 subagent 或 hook 完成。各步骤有推荐提示词与工作流同时对 SKILL 调用方式进行改造减少主 context 消耗还设计了精准对话流。七、落地步骤步骤一项目级上下文持久化在数仓项目目录下创建 .claude/CLAUDE.md。步骤二配置 hooks 自动验证创建 .claude/settings.json hooks/ 目录。步骤三创建 subagents 隔离高 token 操作创建三个核心 subagent 文件。八、Harness 工程能解决的核心问题数仓 AI 开发当前的本质瓶颈是语义理解Harness 工程的本质是把语义和规范从不可靠的 LLM 记忆中迁移到确定性的 hooks 持久化文件里。它能解决字段口径遗忘导致的计算错误、需求理解偏差导致的返工、SQL 规范执行不一致、大型需求开发中的 context 耗尽四类问题与传统数仓 AI 开发方式相比有明显优势让数仓 AI 开发从对话驱动的一次性辅助升级为规则嵌入的流水线自动化。