写在前面昨天我刚刚写完了MCP相关的博客身边就有朋友问我“MCP和最近大火的Agent Skills到底什么关系是不是以后只用Skills就够了”说实话这个问题我也纠结过一阵。2026年初Skills几乎刷屏了整个AI开发者社区Anthropic、OpenAI、微软纷纷跟进生态技能数量在短短几个月内突破85,000个主流支持平台达27家。但Skills究竟从哪来它和MCP到底谁替代谁在Agent架构中又扮演什么角色带着这些问题我花了三周时间调研和实践本文将逐一拆解。一、Skills从哪来——一段跨越二十六年的技术演进史Skills这个概念其实比很多人想象的要老得多。源头一强化学习的“选项框架”1999年Rich Sutton和他的学生提出了一个叫Options Framework的理论框架。核心想法是Agent应该能自己发现和组合可复用的行为模块而不是每次都从零开始、一步一步试。但那个年代的Skill困在神经网络的权重矩阵里不可解释、不可迁移、不可编辑。你训练出一个“开门”的Skill想把它用到另一个环境里几乎不可能。源头二Voyager的代码化突破这个困局持续了24年直到2023年Jim Fan等人的Voyager项目在Minecraft里把Skill从权重拉到了代码里。在那里GPT-4驱动的Agent在游戏中自主探索每学会一个新能力就把它写成一段JavaScript函数存进Skill Library。结果Voyager获得的独特物品数量是前代最强方法的3.3倍解锁科技树的速度快了15.3倍。代码形态的Skill意味着它天然可解释、可编辑、可组合、可迁移——这才是26年里真正的拐点。源头三Anthropic的标准化推进2025年10月16日Anthropic在Claude 3.7中正式推出Claude Skills功能定位解决通用大模型在垂直场景中“知道但不会做”的问题。两个月后的12月18日Agent Skills作为开放标准被正式发布规范与SDK同步上线至agentskills.io。几乎同一时间微软在VS Code与GitHub中集成了这套标准Cursor、OpenCode等主流编码Agent纷纷跟进OpenAI也悄悄在Codex文档中增补了Skills支持。为什么Anthropic要推这个标准核心原因在于大模型厂商发现了一个根本性问题Agent光有“嘴”不够还得有“脑子里的专业知识”。MCP、CLI等工具给Agent装了“手脚”但脑子里没有专业知识。Skills补的就是这一层——不是“你整体上能调用什么工具”而是“一件具体的事你该怎么把事做对”。二、Skills到底是什么——一个文件夹三层加载机制如果你打开一个Skill文件夹看到的目录结构大致如下my-skill/ ├── SKILL.md # 必需核心指令文档 ├── scripts/ # 可选可执行脚本Python/Bash等 ├── references/ # 可选参考文档和规范 └── assets/ # 可选模板、素材等资源其中SKILL.md是唯一必需的文件。它分为两部分YAML元数据块name和description约30-50 tokens和Markdown指令体详细的操作流程。Skill最精妙的设计在于“渐进式披露”Progressive Disclosure机制第一层元数据层Agent启动时只加载每个Skill的name和description约30-50 tokens。这意味着你可以有100个Skills启动成本仅3000-5000 tokens几乎不影响上下文窗口。第二层指令层只有当Agent判断某个Skill与当前任务相关时才加载完整的SKILL.md内容约500-5000 tokens。第三层资源层Scripts和references只有在SKILL.md明确指示时才被读取且不会一次性全部加载。实测数据显示在处理长链条业务流程时这套架构能将上下文Token消耗降低60%-80%。这里有一个容易被误解的地方Skill本质上是一个文件夹不只是Markdown文件。Anthropic内部工程团队将Skill分成了9类包括库与工具使用、验证技能、数据访问、工作流自动化等远远超出了“存Prompt的地方”这一认知边界。三、Skills vs MCP不是替代是分工协作这是社区讨论最多、也最容易混淆的问题。我们直接看最核心的区别再看一个具体场景你要写一份市场分析报告。MCP负责连接行业数据库获取数据、调用网络爬虫抓取动态、访问API收集信息Skills负责按照预设的报告结构组织信息、使用分析框架解读数据、采用标准写作风格表达观点“这就像厨师做菜MCP提供了各种食材和厨具Skills提供了烹饪方法和口味偏好。”一个重要结论Skills不仅不会取代MCP二者反而是天然互补的关系。Skills可以直接调用MCP暴露的工具——一个Skill可以在SKILL.md中写明“使用GitHub MCP Server创建PR”Agent读取这个Skill后就会通过MCP协议调用GitHub接口。在架构层面Skill的定位恰好介于Tool和Agent之间Tool是操作层Skill是能力层Agent是调度层。四、Skills在Agent中扮演什么角色——Agent的“手脚说明书”前面我们用过一张厨师做菜的比喻但从工程架构的角度可以把Agent的能力拆解为三层工具层Tools原子化操作如“发送HTTP请求”“读取文件”“执行SQL”技能层Skills封装好的做事方法如“按照OWASP标准做代码安全审查”“生成符合团队规范的PPT”调度层Agent理解用户目标规划步骤决定调用哪个Skill如果缺少Skills这一层Agent的逻辑会非常脆弱要么直接调用Tool太底层、太零碎要么把一堆逻辑塞进System Prompt一长就失灵、一改就崩。Skill通过结构化封装解决了这三个痛点职责单一每个Skill只专注一件事可测试Skill的输入输出可以像函数一样写测试可组合复杂任务可由多个Skill协作完成把话说得更直白一点如果说大模型是新的计算单元Multi-Agents框架是新的操作系统那么Agent Skills就是智能体的.apk是AI领域的Docker镜像。截至2026年初公开可用的Agent Skills已超过85,000个支持标准的主流平台达27家Linux基金会也已启动讨论拟将Agent Skills纳入其AI Data基金会的候选标准之一。社区中甚至还出现了EvoSkill这样的自我进化系统——通过失败分析自动发现并优化Skills使Agent在OfficeQA金融文档问答任务上准确率从60.6%提升至67.9%在SealQA对抗性搜索问答上实现了12.1个百分点的提升。这意味着Skill正在从一个“静态的能力包”演变为“可以自进化、自优化的能力资产”。未来的AI Agent不再靠人工一点一点调教而是靠Skill库的持续迭代和进化。五、实践建议什么时候该写Skill什么时候该配MCP基于我的调研和少量实践给出三条实用的判断准则✅ 适合写Skill的场景你有重复性的工作流程如代码审查、周报生成、文档格式转换团队有一套固定的操作规范如安全审计流程、发布前检查清单你希望AI在跨对话中保持一致的行为标准✅ 适合配MCP的场景你需要访问外部系统和数据GitHub、数据库、Slack API需要实时获取最新信息股价、天气、新闻工具本身已经以API形式存在只需要一个标准化的接入层✅ 最佳实践是“Skills MCP”混合架构用MCP接入外部能力用Skills定义如何使用这些能力Agent作为调度层在两者的协作下完成任务以Anthropic官方PDF Skill为例它既包含SKILL.md定义处理PDF的步骤和逻辑又可以调用MCP暴露的文件系统接口来读取和写入PDF文件。总结Agent Skills的演进本质上是从“权重内隐式记忆”到“代码化显式知识”的范式转移。1999年Options Framework把Skill困在权重矩阵里2023年Voyager用代码把Skill解放出来2025年Anthropic用标准化将其推向生态——这条二十六年的演进路线折射出AI能力工程化的清晰方向。Skill与MCP的关系用一个最简洁的公式可以概括MCP负责“手脚”Skills负责“说明书”。前者解决AI能不能连接到外部世界后者解决AI能不能按你的标准把事情做对。二者不是替代关系而是分工协作、共同构成Agent完整能力体系的两大支柱。对于正在构建RAG知识库或AI应用的开发者来说Skills提供了一条极低门槛的路径——你不需要写复杂的MCP Server一个Markdown文件就能让Agent学会按你的方式做事。而随着Skill生态突破85,000个技能、跨平台支持持续扩张它正在成为AI应用开发中不可或缺的基础设施层。