本文分享了作者三年内学习与实践大模型的心路历程从最初的向量检索到搭建Agent平台再到垂类场景应用见证了行业从概念炒作到工程落地的转变。文章强调数据质量、模型理解业务链路的重要性并指出随着模型能力提升Agent平台的治理问题日益凸显。作者认为大模型并非魔法而是让不可能变可能的重要工具工程师的投票最终决定了哪些技术能真正落地。一、初识对话框里的好奇2023 年初我第一次在对话框里输入指令时并没有意识到这会彻底改变我的职业轨迹。那时我主要从事业务系统的开发维护工作每天面对的是接口设计、数据流转和业务逻辑。面对 ChatGPT 这种能够理解复杂意图、甚至能写代码的系统我最初的感受更多是好奇这个“黑盒”到底能如何接入我熟悉的业务系统二、2023从 LangChain 到向量库后来 LangChain 的流行给了我们这群开发者一个切入点。那时候大家都在探索如何让模型“读懂”公司的内部文档。我也从零开始学习向量检索相关的东西。2023 年年中我在公司环境里搭了一些基础服务开源的向量数据库试图解决模型在专业领域知识缺失的问题。那时候还没有系统学习 RAG只是因为框架里用到了这些东西就一点点跟着补。在那个阶段我参加了一场 AIGC 应用大会。会场里几乎所有人都在讨论“助手”——知识库助手、办公助手。虽然大家对未来充满期待但落到产品形态上大多还停留在简单的问答层面。这也挺符合 2023 年的行业状态ChatGPT 把大模型带到了大众面前GPT-4 提高了大家对模型能力的想象OpenAI 的插件、function calling、Assistants API 又让开发者看到模型接工具的可能性。AutoGPT 也在那一年火了一阵子大家第一次开始认真讨论 Agent。但在大多数公司里真正能落地的还是问答、摘要、知识库这一类场景。三、数据质量比模型更重要的瓶颈做知识库的过程中我发现模型的能力上限往往被数据质量所限制。当时模型上下文没有现在这么长多模态能力也没现在这么强。PDF 里的表格、图片模型根本看不懂。为了让模型理解复杂版式我们投入了大量精力在文档清洗上要做切块要做混合检索还要借助 OCR 处理图片和表格。当时还记得 MinerU 这类 PDF 解析工具很火因为大家都卡在类似的问题上。那时候我才明白模型再强大如果输入的信息是混乱的输出的结果也必然不可靠。四、代码检测模型看不懂业务链路我们还尝试过利用大模型进行代码质量检测。当时主要依靠 Prompt 工程通过少样本学习让模型识别潜在的问题。为了让模型拿到更多信息还调研了一些程序分析技术。但实际效果并不理想误报率极高。模型往往能指出语法层面的风险却无法理解复杂的业务链路。例如它会提示某处存在空指针风险却不知道前置逻辑已经完全规避了这种可能——业务代码链路很长空值根本不会流转到这个逻辑中。对熟悉业务的人来说这不是问题对模型来说它看到的只是局部代码。这件事让我第一次清楚地意识到模型能力和任务能力不是一回事。前者是模型在 benchmark 上能做到什么后者是在你的具体业务环境里能做到什么。中间的差距就是工程要填的。五、2024搭建 Agent 平台进入 2024 年行业开始频繁提及 Agent智能体的概念。我们也开始正式搭建内部的 Agent 平台。那时行业也在变。Gemini 1.5 把长上下文推到很高的位置Claude 3、GPT-4o 让多模态和实时交互变得更直观。到了 2024 年下半年o1、Computer Use、MCP 这些东西陆续出来Agent 的讨论明显多了起来。但在我们真正做平台的时候完全自主规划的 Agent 在工程上还很难落地目标漂移和重复执行是常态。因此我们选择了工作流编排的路径通过意图识别、工具广场和逻辑指令人为地为模型设定执行边界。平台架子本身不算特别难因为那时候大家的思路大体类似。真正麻烦的是细节模型什么时候该调用工具工具失败了怎么办中间结果怎么判断用户什么时候介入这些问题每一个都要处理。这样做虽然不酷但至少不会在半夜接到报警电话。现在回头看那个阶段的 Agent 更像是“人在外面帮模型搭轨道”。六、UI 自动化理想与现实的落差期间我们还在 UI 自动化方向做过一些探索试图让模型自动操作网页。理想的场景是用户只需下达指令模型就能自动完成复杂的网页交互。刚开始会觉得方向很自然但实际做起来问题很多。网页状态不稳定元素会变反爬检测页面会弹窗登录态会过期业务系统还有很多非标准交互。人操作网页的时候很多动作是凭经验顺手完成的但让系统自动做每一个“顺手”都可能变成异常分支。最后这个方向没能很好推广主要原因不是技术一点都做不了而是用户使用成本太高。用户要理解自动化的边界要在失败时知道怎么处理这就很难。这也让我后来在看到 Anthropic 发布 Computer Use、OpenAI 发布 Operator、Google 做 Gemini Computer Use 时产生了很多共鸣。GUI Agent 这条路不是没人想过只是它真的很难。界面是给人用的系统要稳定地操作它中间差了很多环境不确定性。GUI Agent 的真正难点往往不在于点击动作本身而在于对动态环境的适应能力。七、垂类场景从平台到业务2024 年底我转入另一个团队负责一个垂类场景的 Agent 应用。这一年的工作变得更加贴近业务。做平台时更多是在搭能力做垂类应用时更多是在看业务效果优化模型加一些工程技巧再加兜底策略然后通过实验验证效果。技术没有特别酷甚至很多地方还挺朴素但只要指标能往前走就是有价值的。DeepSeek-R1 发布时尽管其推理能力令人惊艳行业里讨论得也很热但在我们自己的场景里还要考虑资源和实时性。公司这类模型资源不够算力配额根本跟不上一些原本实时处理的场景最后只能改成离线处理。还有一些对响应速度要求极高的环节我们直接使用了简单的正则判定逻辑。这种做法虽然看起来不够“智能”但效果能满足要求延迟也低。做业务久了之后越来越能接受这种事情不是所有问题都必须交给大模型。有些地方规则就够了有些地方缓存就够了有些地方离线处理更合适。八、AI Coding从失败到突破2025 年初AI Coding 的成熟给了我很大的触动。其实 2024 年初我就试过用 AI 写前端当时也想用 AI 写一些自己想做的小东西但模型输出质量不太稳定我自己又不懂前端最后没有成功。一年后再用 Cursor感受完全不一样。模型的代码能力、工具的上下文管理、编辑器里的交互方式都成熟了很多。我用它实现了一些憋了很久的小想法还顺手写了篇公众号文章。没想到那篇文章反响超出预期阅读量达到了我之前的很多倍。这件事对我来说挺有意思。一年前同样的想法我做不出来一年后工具和模型都往前走了一步事情就变得可行了。后来 Claude Code、Codex 这些编码 Agent 继续往前发展我也越来越理解为什么代码场景会是 Agent 最早成熟的方向之一。代码任务天然有反馈改完能不能编译测试能不能过改动能不能 review出了问题能不能回滚这些都很明确。相比之下浏览器 Agent、办公 Agent、通用 Agent 的结果就更难判断。九、2026从编排到治理2026 年初我又继续做 Agent 平台开发。现在对 Agent 平台有一个明显的感知平台里的流程编排变少了——那些写死在图里的逻辑越来越多地被模型自主判断替代。这不是偶然是模型推理能力和工具调用能力到了某个阈值后自然发生的变化。这不是说工作流编排没有价值了而是模型能力确实变强了。推理模型、工具调用、长上下文、MCP 这些能力叠在一起之后模型能承担的部分变多了。但这并不意味着系统变简单了。恰恰相反编排少了意味着你失去了一层显式的控制手段。取而代之的是需要更多地考虑模型有没有拿到它不该拿的权限它在某个节点上做了一个决策我能不能审计到它失败了系统知不知道它的调用成本和资源消耗有没有预算上限这些问题在编排时代被结构吸收了进入自主决策时代之后它们浮出来变成了治理问题。十、热度与留存工程师的投票2026 年初OpenClaw 火过一阵。大家又开始幻想着 Agent 能统治世界新概念会带来想象力。但没过几个月热度慢慢下去大家的重心又回到了 Claude Code 和 Codex 上。这个过程也挺正常的。不是新概念不好而是工程师最终会用脚投票真正能留下来的往往还是那些能进入日常工作流、能反复使用、结果能验收的工具。结语三年后的冷静今天已经是 2026 年 5 月。回顾这三年多我从最初的向量服务调试到搭建内部平台再到垂类场景的实验验证再到现在看着编排减少、治理增加心态已经从最初的兴奋转变为现在的冷静。如果把这几年串起来看我自己的工作轨迹其实很普通从知识库开始到代码分析到平台搭建到 UI 自动化再到垂类应用再到现在重新看平台的演进。但它刚好和大模型的发展节奏叠在一起。2023 年大家还在摸索怎么把大模型接进应用里所以 LangChain、RAG、向量检索很重要。2024 年模型上下文变长多模态能力增强Agent 平台开始变多但很多场景仍然依赖编排和人工兜底。2025 年推理模型和垂直 Agent 集中出现代码 Agent、研究 Agent、浏览器 Agent 都开始有了更清晰的产品形态。到了 2026 年讨论重点慢慢从“Agent 能不能做事”变成“Agent 怎么被管理”。权限、成本、审计、失败恢复这些工程问题变得越来越重要。我写这些不是为了证明自己踩中了哪一波趋势也不是想总结出什么行业定律。更多只是记录一下这几年自己的工作经历以及这些经历刚好如何映照了大模型和 Agent 的发展。有时候回头看会觉得这几年变化很快。2023 年还在调检索服务和 Prompt2024 年开始搭平台2025 年用 Cursor 写代码2026 年大家已经在讨论 Agent 的治理和长期运行。但真正落到每天的工作里变化又没那么戏剧化。很多时候还是在处理文档质量、误报、延迟、成本、兜底、用户使用成本这些问题。大模型确实越来越强了Agent 也确实越来越像一个能干活的系统。但在工程现场它们从来不是什么魔法。它们只是让很多原来不可能的事慢慢变成“可以试试”再从“可以试试”变成“也许能上线”最后才可能变成“可以长期运行”。这大概就是我这几年最大的感受。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取