Archon Specs：用约束性规范与实时验证消除AI代码生成中的幻觉问题

张

张建站

2026/5/26 4:45:01

10分钟阅读

1. 项目概述一个不“幻觉”的AI后端生成器最近几年AI代码生成工具火得一塌糊涂从Copilot到各种大模型驱动的生成器几乎每个开发者都或多或少用过。但用过的朋友肯定都踩过同一个坑AI幻觉Hallucination。你让它生成一个用户登录的API它可能给你写出一套复杂的、但完全无法运行的代码或者凭空捏造一些不存在的库和函数。这种“一本正经地胡说八道”不仅浪费调试时间更让开发者对AI生成的代码缺乏基本信任不敢直接用于生产环境。我花了相当长的时间和团队一起捣鼓出了一个我们称之为Archon Specs的AI后端生成器。它的核心目标非常明确彻底消除或极大限度地减少AI在生成后端代码时的“幻觉”行为生成可直接运行、符合最佳实践、且架构清晰的代码。这不是另一个简单的提示词工程包装而是一套结合了约束性规范、上下文增强和实时验证的完整系统。简单来说Archon Specs 是一个接收高层次业务描述比如“创建一个博客系统包含用户、文章、评论支持JWT鉴权”然后输出一整套可部署的后端项目代码包括数据库模型、API路由、业务逻辑层、中间件、测试用例甚至Docker配置的工具。它的独特之处在于生成过程被一系列严格的“规格说明书”Specs所约束和引导确保AI的创造力被框定在正确、可行的技术路径上从而产出可靠、一致的成果。2. 核心设计思路用“规格”对抗“幻觉”为什么现有的AI代码生成工具容易“幻觉”根本原因在于它们过于依赖模型的“自由发挥”。当你给一个通用大模型一个模糊的指令时它会在其庞大的训练数据中寻找模式并生成看似合理的文本但这文本在具体的技术上下文、项目约定和依赖环境中很可能是不正确或矛盾的。Archon Specs 的设计哲学是“引导而非放任”。我们不再让AI天马行空地想象“一个后端应该是什么样子”而是为它提供一套详尽的、结构化的“建筑图纸”和“施工规范”。这套规范就是Archon Specs它包含了以下几个关键层面2.1 技术栈与架构范式锁定在项目初始化阶段我们就必须明确技术栈。这不是让AI去猜而是通过一个配置化的选择器来锁定。例如后端框架Node.js (Express/NestJS) Python (Django/FastAPI) Go (Gin) Java (Spring Boot) 等。数据库PostgreSQL MySQL MongoDB 并明确ORM/ODM如 Prisma Sequelize Mongoose TypeORM。身份验证JWT OAuth2.0 Session-Cookie。API风格RESTful GraphQL。一旦选定生成的所有代码都必须严格遵循该技术栈的官方约定和社区最佳实践。AI模型在生成时其上下文会被“注入”这些约束它相当于在一个预设好的技术沙箱里工作大大减少了使用错误包或错误语法的可能性。2.2 领域模型与API契约先行这是对抗“幻觉”最核心的一环。我们要求用户或产品经理先以结构化的方式定义核心的领域模型Domain Models和API端点契约API Contracts。领域模型定义这不仅仅是定义数据库表。我们会用一个更丰富的DSL领域特定语言或结构化表单来描述实体。例如定义一个User模型Model: User Fields: - id: UUID, primary key, auto-generated - username: String, unique, required, minLength: 3, maxLength: 30 - email: String, unique, required, format: email - passwordHash: String, required, writeOnly (never returned in API responses) - avatarUrl: String, optional - createdAt: DateTime, auto-generated on create - updatedAt: DateTime, auto-generated on update Relations: - hasMany: Post - hasMany: Comment这个定义明确规定了字段类型、约束、关系以及敏感字段如passwordHash的处理方式。AI在生成模型代码、数据库迁移脚本、甚至输入验证逻辑时都必须严格遵守此定义。API契约定义为每个核心业务操作定义清晰的API端点。例如针对User的CRUDResource: /users Operations: - POST /users: Create a new user. Request body matches User model (excluding id, timestamps). Returns the created user (excluding passwordHash). - GET /users: List users with pagination (page, limit), filtering (by username), and sorting. Returns array of user summaries. - GET /users/{id}: Get a specific user by ID. Returns full user details (excluding passwordHash). - PUT /users/{id}: Update a user. Request body contains updatable fields. Returns updated user. - DELETE /users/{id}: Delete a user (soft delete by setting isActive: false).契约中明确了HTTP方法、路径、请求体结构、响应体结构以及行为如分页、过滤。AI在生成控制器Controller和路由Router代码时就像是在做“填空题”将业务逻辑填充到已经定好的框架里从而保证了API接口的一致性。2.3 上下文增强与实时验证即使有了严格的SpecsAI在生成具体函数体时仍可能出错。因此我们引入了两层保障上下文增强Context Augmentation在提示Prompt中我们不仅包含用户的需求和Archon Specs还会动态插入以下内容选定的技术栈的官方文档片段例如FastAPI的依赖注入用法。项目已生成部分的代码保持上下文连贯避免重复生成或冲突。常见的、针对当前任务的设计模式代码片段例如Repository模式、Service层的错误处理模板。这相当于给AI配备了一个“实时技术手册”和“项目记忆”让它生成代码时参考的依据更具体、更准确。实时验证与回退Real-time Validation Fallback生成代码不是一步到位的。我们设计了一个多阶段管道阶段一草稿生成。AI根据Specs和上下文生成代码初稿。阶段二静态分析。立即用语言特定的Linter如ESLint for JS, Pylint for Python和类型检查器如TypeScript编译器 MyPy对草稿进行快速扫描检查语法错误、类型不匹配和明显的风格问题。阶段三模式匹配与修正。如果静态分析发现问题系统不会直接让AI“重想”那可能引入新幻觉。而是将错误信息、出错的代码行以及对应的Archon Specs片段再次组合成新的、更具体的提示发送给AI进行“局部修正”。这个过程可能迭代几次。阶段四模板化回退。如果AI在多次修正后仍无法生成合规代码对于极其标准化的部分如CRUD的Service层系统会触发回退机制从一个预置的、经过千锤百炼的代码模板库中直接选取并填充生成对应代码。这确保了基础功能的绝对可靠性。通过这套组合拳Archon Specs 将AI从一个“充满想象力的诗人”转变为一个“严格按图施工的工程师”从根本上抑制了“幻觉”的产生。3. 工作流程与核心环节拆解理解了设计思路我们来看看Archon Specs具体是如何工作的。整个流程可以被分解为几个清晰、自动化的阶段。3.1 阶段一需求结构化与Specs创建这是唯一需要较多人工输入的阶段但好的开始是成功的一半。项目初始化配置用户通过UI或CLI工具像做选择题一样选定技术栈、代码风格如Airbnb JavaScript Style Guide、项目根目录等基础设置。这些选择会被保存为一个archon.config.json文件。领域建模在可视化编辑器或YAML文件中定义实体模型。工具会提供实时验证比如检查字段名是否合法、关系定义是否循环依赖。这里的一个实操心得是优先定义核心实体和它们之间的关系属性细节可以后续补充。先抓住“用户-文章-评论”这样的主干比一开始就纠结“用户的头像URL最大长度是多少”更重要。模型定义完成后会生成对应的specs/models/目录下的规范文件。API契约设计基于定义好的模型为每个资源设计API。工具通常会根据模型自动建议一套标准的RESTful CRUD端点用户可以在此基础上增删改查。这里的关键是明确每个端点的输入输出Request/Response Schema。我们会利用JSON Schema来精确描述这些Schema也会被存入specs/api/目录。注意很多开发者习惯直接描述功能比如“我要一个能发文章的功能”。但在Archon Specs里你需要稍微转变思维先思考“文章Post这个资源有哪些属性”和“针对文章资源允许哪些操作创建、读取、更新、删除、列表查询”。这种“资源导向”的思考方式能让生成的代码结构更清晰。3.2 阶段二AI驱动代码生成这是系统的核心引擎。我们以生成一个“创建文章Create Post”的API端点为例拆解其内部过程。任务分解与提示词构建系统不会一次性生成整个项目。而是将任务分解为原子单元例如生成数据库迁移文件或模型定义文件。生成实体类Entity/Model。生成数据仓库层Repository或数据访问对象DAO。生成服务层Service业务逻辑。生成控制器层ControllerHTTP处理。生成路由注册。生成请求/响应验证DTOData Transfer Object。生成单元测试和集成测试骨架。对于“创建文章”这个任务系统会为上述每个原子任务构建一个高度特化的提示词Prompt。这个提示词模板包含了角色指令“你是一个经验丰富的[Node.js/NestJS]后端工程师。”任务描述“根据以下Archon Spec生成创建文章Post的Service层类。”相关Archon Spec片段贴入Post模型定义和POST /posts的API契约。技术栈上下文“本项目使用NestJS框架TypeORM作为ORM采用Repository模式。”代码风格要求“使用ESLint Airbnb规则使用类而不是函数。”项目已有上下文“这是已经生成的UserService请参考其错误处理风格...”输出格式指令“只输出完整的TypeScript代码无需解释。”约束性生成与静态检查AI根据这个充满约束的提示词生成代码草稿。生成后立即触发本地的TypeScript编译器tsc --noEmit和ESLint进行扫描。如果发现“Post实体中找不到authorId属性”这类错误可能是因为AI幻觉了一个不存在的字段生成管道会捕获这个错误。迭代修正错误信息和出错的代码行连同原始任务提示被组合成一个新的修正提示“上一轮生成的代码在第X行有类型错误Property ‘authorId‘ does not exist on type ‘Post‘。请根据提供的Post模型Spec进行修正确保只使用模型中定义的字段。” 然后AI进行针对性重生成。通常1-2轮迭代后代码就能通过静态检查。3.3 阶段三项目组装与依赖管理所有原子代码单元生成并通过验证后系统进入组装阶段。文件结构生成按照选定技术栈的约定俗成的项目结构如NestJS的src/modules/post/目录将生成的实体、控制器、服务等文件放置到正确位置。依赖注入与模块集成对于像NestJS、Spring Boot这类框架需要生成或更新模块Module文件将新生成的Provider服务、Controller正确声明和导出。Archon Specs 会分析代码中的Injectable()装饰器或类似注解自动更新对应的模块文件。依赖包管理当生成的代码中引入了新的第三方库例如生成了使用class-validator进行DTO验证的代码系统会自动检测并在package.json(Node.js) 或requirements.txt(Python) 或pom.xml(Java) 中添加相应的依赖项及其推荐版本。生成辅助文件根据配置自动生成相关的Dockerfile、docker-compose.yml用于数据库等服务的容器化、环境变量示例文件.env.example、以及基础的CI/CD配置文件如.github/workflows/test.yml。至此一个完整、可运行的后端项目代码库就生成了。用户可以直接进入git commit和开发调试阶段。4. 关键技术实现细节与难点攻克要让这套系统稳定运行背后有几个技术难点需要解决。4.1 提示词工程Prompt Engineering的精细化我们面对的不是单一任务而是从模型定义到测试用例的数十种不同类型的代码生成任务。为每种任务设计高效、无歧义的提示词模板是关键。难点如何让AI准确理解“Repository模式”在TypeORM下的具体写法并与“Service层”清晰分离解决方案我们建立了“示例对Example Pairs”库。即对于“生成TypeORM Repository”这个任务我们手动编写了多个不同复杂度实体如简单的Tag 带有关系的Post的标准Repository代码作为“正例”同时也收集了一些AI容易生成的错误写法作为“反例”。在构建提示词时随机选取1-2个正例作为“Few-shot Learning”的样本注入提示词中。这比单纯用文字描述“请用Repository模式”要有效得多。实操心得是示例的质量远大于数量。一个清晰、符合最佳实践的示例抵得上十段模糊的文字描述。4.2 上下文管理的艺术随着项目生成代码库会越来越大。在生成后续模块时如何让AI知晓“项目已经有什么”以避免冲突和重复难点生成Comment模块时AI需要知道Post和User模块已经存在并且了解它们的接口才能正确建立关系和导入。解决方案我们实现了一个“项目上下文向量数据库”。将所有已生成的文件进行切片chunk通过嵌入模型Embedding Model转换为向量存入轻量级的向量数据库如ChromaDB。当需要为某个新任务构建提示词时系统会进行向量相似度检索找出与当前任务最相关的已生成代码片段例如所有与“JWT鉴权”、“用户服务”相关的代码并选取最重要的几段作为“项目上下文”插入提示词。这确保了AI的生成是基于整个项目现状的具有连贯性。4.3 静态验证与回退机制的可靠性静态分析工具并非万能有时会漏报或误报。难点生成的代码可能通过了ESLint检查但运行时逻辑错误比如在创建用户前没有检查邮箱是否已存在。解决方案我们采用了“多层验证”策略。语法/类型层tsc,eslint,pylint。这是第一道防线解决硬性错误。模式匹配层我们编写了一系列针对常见业务逻辑的规则检查器。例如一条规则是“对于POST /resources对应的Service创建方法必须在操作前检查唯一性约束如邮箱、用户名”。系统会用AST抽象语法树分析工具解析生成的Service代码检查是否存在数据库查询如findOne和条件判断语句。如果缺失即使代码语法正确也会触发一个“逻辑完整性警告”并可能启动回退机制用预置的、包含完整性检查的模板替换该段代码。模板化回退库对于最通用、最易出错的代码模式如基本的CRUD服务层、JWT验证中间件我们直接维护一个手写的高质量模板库。当AI多次生成不符合要求的代码或用户对某个模块有极高的稳定性要求时可以配置为直接使用模板。这是保证“不幻觉”的最后一道也是最坚固的防线。4.4 处理复杂业务逻辑与“非标准”需求AI擅长处理有规律的模式但真实项目总有各种“奇葩”业务逻辑。难点用户需求是“用户发表文章后自动关注他的人会收到通知并且文章内容需要经过敏感词过滤”。解决方案Archon Specs 通过“自定义钩子Custom Hooks”和“逻辑占位符Logic Placeholders”来处理。在定义Post模型的API契约时用户可以在POST /posts操作下声明一个afterCreate钩子并简要描述“调用通知服务NotificationService发送新文章通知”。在生成Service代码时AI会生成一个方法骨架并在相应位置插入清晰的注释和占位符例如async createPost(createPostDto: CreatePostDto, userId: string): PromisePost { // 1. 检查用户权限... // 2. 敏感词过滤 (待实现: 调用过滤服务 FilterService.scanText) // const filteredContent await filterService.scanText(createPostDto.content); const filteredContent createPostDto.content; // 临时占位 const newPost this.postRepository.create({ ...createPostDto, content: filteredContent, authorId: userId, }); await this.postRepository.save(newPost); // 3. 发送新文章通知 (待实现: 调用通知服务 NotificationService.sendNewPostAlert) // await this.notificationService.sendNewPostAlert(newPost.id, userId); return newPost; }系统会识别这些// 待实现的注释并在项目根目录生成一个TODO.md文件集中列出所有需要开发者手动填充的业务逻辑点。这样AI负责了所有结构化的、模板化的代码占80%而开发者只需专注于那20%真正体现业务核心价值的自定义逻辑。5. 实战效果、常见问题与优化方向经过内部和早期用户的大量测试Archon Specs 在消除“幻觉”方面效果显著。5.1 效果评估代码可直接运行率对于标准CRUD操作生成的项目首次npm start或docker-compose up的成功率超过95%。剩下的5%通常是环境配置差异如数据库连接字符串导致与AI生成代码本身无关。逻辑一致性由于严格遵循Archon Specs生成的API端点、数据模型、验证规则三者之间保持了高度一致避免了手动开发中常见的“接口文档与实现不符”的问题。开发效率对于一个包含5-6个核心实体、30个左右API的中等复杂度后台管理系统从零生成到可运行的基础代码时间从人工开发的数天至一周压缩到30分钟以内。开发者可以立即进入业务逻辑定制和界面联调阶段。5.2 遇到的典型问题与解决策略即便有严密设计实践中还是会遇到各种问题。问题现象可能原因排查与解决策略生成的DTO验证规则缺失或错误AI对class-validator或Joi等库的装饰器/规则不熟悉。1.强化示例在提示词中提供更丰富的验证示例对。2.启用回退对于常见的字段类型邮箱、URL、字符串长度直接使用模板库中的标准验证规则片段。数据库关系映射错误如TypeORM中ManyToMany配置不对关系定义复杂AI容易混淆JoinTable的位置。1.Specs细化在模型定义Spec中明确指定关系的“拥有方”Owning Side。2.生成后检查编写一个简单的AST脚本在生成后自动扫描实体文件检查关系装饰器配置的常见模式是否正确并给出修正建议。生成的代码风格与项目已有代码不一致提示词中的风格约束不够具体或AI在生成长代码时“遗忘”了开头约束。1.分而治之将长代码生成任务如整个Controller拆分为更小的函数/方法级生成任务。2.后格式化生成完成后统一用项目配置的Prettier、Black等代码格式化工具进行格式化覆盖AI的风格偏差。对于非常小众的技术栈或库支持不佳训练数据中该技术栈的样本不足。1.社区贡献开放Specs模板和示例对库允许社区贡献特定技术栈的配置。2.降低预期明确告知用户对于小众技术栈系统可能更多依赖基础模板需要更多手动调整。5.3 未来优化方向“学习模式”与个性化让系统能够学习特定开发团队或个人的编码习惯如错误处理偏好、工具函数命名习惯让生成的代码更贴近团队风格减少后期调整。更智能的上下文感知结合代码库的git历史让AI在生成新功能时能“意识”到近期修改过的相关模块避免生成与正在进行中的重构相冲突的代码。从生成到维护不仅限于从零生成未来可以探索如何让Archon Specs 理解现有代码库并根据更新的Specs如API契约变更自动生成代码补丁或迁移脚本实现后端代码的“同步维护”。多模态输入支持从产品需求文档PRD、界面设计图Figma/ Sketch甚至产品经理的口头描述中自动提取和结构化领域模型与API契约进一步降低使用门槛。构建Archon Specs 的过程是一个不断与AI的“不确定性”做斗争的过程。我们的核心经验是不要试图创造一个“万能”的AI开发者而是创造一个“超级高效且听话”的AI助手。通过严谨的规范、清晰的上下文和强大的验证机制将AI的创造力引导到正确的轨道上让它负责那些繁重、重复但容易出错的“搬砖”工作从而让人类开发者能更专注于架构设计和核心业务创新。这套思路或许不仅是后端生成也是未来所有AI辅助编程工具走向成熟和可靠的必经之路。

Geolib地理计算库：零依赖的经纬度处理终极指南

Geolib地理计算库：零依赖的经纬度处理终极指南【免费下载链接】geolib Zero dependency library to provide some basic geo functions 项目地址: https://gitcode.com/gh_mirrors/ge/geolib 你是否曾经在开发地图应用时，需要计算两个地点之间的…...

2026/5/26 4:43:22 阅读更多 →

【解决方案】Windows 11 电脑卡死并且鼠标无法移动 - 记录各类问题的解决方案

文章目录1. 问题重述2. 解决方案2.1 确保下次出现可以定位问题2.2 整体的修复尝试解决2.3 2024/11/28更新，电脑又卡住了，定位问题2.4 2024/12/11 自动勾选了SSL3.0问题2.5 2024/12/12/0：06电脑再次死机2.6 找到一个通用的解决方案2.7 对于Win…...

2026/5/26 4:42:54 阅读更多 →

如何使用SQLite Viewer快速加载和分析本地SQLite数据库文件？完整操作指南

如何使用SQLite Viewer快速加载和分析本地SQLite数据库文件？完整操作指南【免费下载链接】sqlite-viewer View SQLite file online 项目地址: https://gitcode.com/gh_mirrors/sq/sqlite-viewer SQLite Viewer是一款强大的在线工具，专为快速加载…...

2026/5/26 4:42:27 阅读更多 →

PS5 NOR修改器终极指南：简单三步修复你的游戏主机

PS5 NOR修改器终极指南：简单三步修复你的游戏主机【免费下载链接】PS5NorModifier The PS5 Nor Modifier is an easy to use Windows based application to rewrite your PS5 NOR file. This can be useful if your NOR is corrupt, or if you have a disc edition…...

2026/5/25 2:11:12 阅读更多 →

毕业论文，如何合规使用AI

2022年11月出现了大语言模型ChatGPT，今年是第一批使用大模型大学生毕业的第一年，如何安全、高效地使用AIGC正在成为不少人关心的重要事情。大学生或研究生毕业论文使用AIGC的核心原则是：把它当成你的“科研实习生”，而不是“代笔枪…...

2026/5/24 0:21:38 阅读更多 →

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap RDP Wrapper是一款让Windows家庭版支持多用户远程桌面的开源工具，但许多用户在系…...

2026/5/24 0:32:45 阅读更多 →