本文针对AI领域新手及程序员深入剖析大模型方向LLM、多模态、AIGC的选择与进阶策略。文章首先澄清了LLM、多模态、AIGC三者间的关系指出不应在宏观概念上纠结而应聚焦于具体技术栈和岗位定位。接着文章详细分析了市场招聘需求将大模型相关岗位分为训练研发、应用落地、多模态研发和AI基础设施四类并对其要求、现实情况及性价比进行了排序。文章强调大模型应用落地结合工程能力性价比最高多模态潜力大但门槛高纯AIGC图像/视频生成需谨慎选择而AI基础设施虽稀缺但偏系统开发。此外文章还探讨了方向的“保质期”、个人起点、组合稀缺性等因素并结合作者自身经历给出建议。最后文章总结出选择方向的决策步骤鼓励读者基于充分信息做出合理选择并通过执行力将选择转化为正确路径。说实话看到这个问题我心里咯噔了一下因为这不就是我自己半年前纠结的东西吗。先交代一下我的情况。中科院计算机硕士在读AI方向还没毕业。研一上学期的时候导师给了我一定的自由度让我选细分方向我在这三个方向之间反复横跳了将近两个月最后做了选择。这两个月里我做了大量的功课——翻招聘网站上的岗位、找不同方向的师兄师姐聊、问实习时的mentor、看各个方向近两年的技术演进趋势、甚至统计了一下几个方向在牛客上的offer讨论帖数量和薪资分布。不敢说我的选择一定是对的毕竟还没经过市场检验。但至少我做这个选择的过程是认真的背后的分析框架可能对你有参考价值。首先这个问题的问法本身就需要修正“LLM、多模态、AIGC选哪条路”——这个分类方式是有问题的。这三个概念不是并列关系。它们之间有大量的重叠而且边界正在变得越来越模糊。我画个关系图你就明白了┌─────────────────────────────────────────────┐ │ 大模型Foundation Models │ │ │ │ ┌──────────────┐ ┌──────────────────┐ │ │ │ 纯语言LLM │ │ 多模态大模型 │ │ │ │ │ │ │ │ │ │ GPT系列 │ │ GPT-4V/4o │ │ │ │ Claude │◄──►│ Gemini │ │ │ │ GLM/Qwen │ │ Qwen-VL │ │ │ │ │ │ │ │ │ └──────────────┘ └──────────────────┘ │ │ │ │ ┌──────────────────────┐ │ │ │ 生成式模型 (AIGC) │ │ │ │ │ │ │ │ 文本生成LLM本身 │ │ │ │ 图像生成SD/DALL-E│ │ │ │ 视频生成Sora等 │ │ │ │ 音频生成 │ │ │ └──────────────────────┘ │ └─────────────────────────────────────────────┘你看出来了吗LLM本身就是AIGC的一种生成文本而最新的LLM几乎都在走多模态路线GPT-4o能处理文本、图像、音频。所谓”纯语言大模型”正在变得越来越少——现在你很难找到一个头部模型是只处理文本的。所以与其纠结”选哪个方向”不如换一个更有操作性的问题在大模型这个大方向下我应该选择哪个具体的技术栈和岗位定位才能在就业市场上最大化我的竞争力这样问就清晰多了。下面我就按这个思路来分析。一、先搞清楚市场上到底在招什么人方向选择如果不跟就业市场的实际需求对照就是在自嗨。我前段时间花了大概一周时间把几个主要招聘平台上跟大模型相关的算法岗JD做了一个粗略的分类和统计。样本不大不严谨但能看出趋势。大模型相关的岗位大致可以分成这么几类第一类大模型训练与基座研发做什么 预训练、SFT、RLHF/DPO对齐、模型架构改进、训练框架优化谁在招 头部大模型公司智谱、百川、月之暗面、DeepSeek等、大厂的基座模型团队要求 通常要求有预训练或大规模训练的经验顶会论文是很大的加分项对分布式训练有理解。门槛最高的一类岗位。现实 岗位数量少因为需要做基座模型的团队本身就不多。而且这类岗位更偏research性质很多团队倾向于招博士或者有顶会paper的硕士。第二类大模型应用与落地做什么 RAG系统搭建、Agent开发、Prompt工程、大模型在具体业务场景的适配和优化、微调和部署谁在招 几乎所有大中型公司都在招因为现在每个公司都想把大模型接入自己的业务要求 熟悉主流大模型的使用和微调有实际的应用开发经验工程能力要求比第一类低但也不能太差现实 岗位数量最多、增长最快的一类。但也正因为门槛相对低竞争的人也最多。同质化比较严重——大家都会调API、都做过RAG怎么做出差异化是个问题。第三类多模态模型研发做什么 视觉语言模型VLM、文生图/文生视频模型、多模态对齐、多模态数据处理谁在招 做多模态的大模型公司、大厂的多模态团队、做AIGC产品的公司图像生成、视频生成等要求 通常需要CV或多模态的研究背景对图像/视频的处理pipeline有了解有相关论文或项目经验现实 需求在快速增长因为多模态是大模型技术演进的明确方向。但供给端也在跟上——很多原来做CV的人在往多模态转。特别是现在大厂哈哈哈第四类AI基础设施与推理优化做什么 模型推理加速、训练框架开发、GPU调度优化、模型量化压缩、serving系统搭建谁在招 所有做大模型的公司都需要而且非常缺要求 扎实的系统编程能力了解GPU架构和CUDA编程理解模型的计算流程现实 这类岗位严格来说不算”算法岗”更偏系统开发。但我把它列在这里是因为它跟大模型紧密相关而且供需关系是这几类里面最好的——需求大能做的人少。咳咳具体怎么知道的感觉出来的哈哈哈哈要是有大佬有不同意见看完这个分类你可能已经有一些感觉了。让我把结论说得更明确一些。二、我的判断从就业角度看各方向的性价比排序以下纯属我个人基于收集到的信息做出的判断不一定对但每一条都有我的理由。性价比最高大模型应用落地 工程能力原因很直接岗位数量最多、需求增长最快、门槛可高可低。“可高可低”是什么意思就是这个方向的下限很低谁都能调个API做个demo但上限很高把一个大模型应用做到真正好用、稳定、高效涉及到大量的工程挑战和技术深度。如果你只停留在”会调API”“做过RAG demo”这个层面你的竞争力很弱——因为这个层面的人太多了。但如果你能做到以下几点中的任何一两个你的竞争力就会显著提升深入理解RAG系统的各种坑并且有实际的解决方案检索质量优化、记忆管理、幻觉控制等能搭建可靠的Agent系统对模型的失败模式和边界有深入认知有模型微调的实战经验知道什么时候该微调、什么时候该用prompt engineering了解模型推理的基本优化手段能跟基础设施团队有效沟通本质上就是在”应用”这个大家都能做的方向上用工程深度做出差异化。这条路对硕士来说最友好因为不需要顶会论文、不需要预训练经验但需要你真的动手做过完整的项目踩过坑解决过问题。再不济你用AI跑一跑然后了解了解代码哈哈哈哈哈潜力最大但门槛也高多模态多模态是大模型技术演进的确定性方向。从GPT-4V开始所有头部模型都在往多模态走。这不是一个”可能会火”的方向而是一个”一定会火而且正在火”的方向。从就业角度看多模态方向的优势在于供给端还没有完全跟上。做纯NLP的人很多但同时懂NLP和CV、能做多模态对齐和融合的人还是相对少的。这种供需差意味着溢价。特别是有一说一现在大厂对于这方面的人才给钱还是非常慷慨的。但门槛也确实更高你需要同时掌握NLP和CV的基础知识多模态的数据处理比纯文本复杂得多这个方向的研究进展非常快你需要持续跟进最新的工作如果你有CV的背景或者对图像和视频处理有兴趣和基础这条路是值得认真考虑的。如果你完全没有CV的基础纯从零开始学多模态时间成本会比较高。两年的硕士时间够不够同时补CV基础和做出有深度的多模态项目需要你自己评估。需要谨慎的方向纯AIGC特指图像/视频生成这里我单独把AIGC中的图像和视频生成拎出来说因为这个细分方向的就业情况比较特殊。从技术上看Stable Diffusion、DALL-E、Sora这些模型确实非常亮眼技术上有很多有意思的问题值得研究。但从就业角度看我的观察是做图像/视频生成的算法岗位数量不算多而且高度集中在少数几家公司。 不像大模型应用岗位那样几乎每家公司都有需求生成式模型的研发主要集中在专门做AIGC产品的公司和大厂的特定团队。而且这个方向的研究门槛比较高——Diffusion Model的理论基础涉及到随机微分方程、变分推断等数学工具要做出有竞争力的成果需要比较扎实的数学功底和研究能力。如果你对这个方向有强烈的兴趣和一定的数学基础可以做。但如果你的目标纯粹是就业性价比不是最高的。当然了最近AI漫剧什么的比较火可能也是一个方向吧不过个人觉得性价比不是很高只是个人看法哈哈哈哈最稀缺但可能不是你想走的路AI基础设施前面提到了这个方向。它的供需关系是所有方向里最好的——极度缺人。但这个方向本质上是系统开发岗不是传统意义上的算法岗。日常工作是写C/CUDA、做性能优化、搭分布式系统跟”炼模型”“做实验”关系不大。一个东南的大学同学他就想做这个方面如果你的兴趣和能力本来就偏系统和工程这是一条非常好的路。但如果你选这个方向是因为”好就业”而不是因为你喜欢做底层系统的活你可能会比较痛苦。三、一些不太好分类但很重要的考虑考虑一方向的”保质期”这个是我花了很长时间才想清楚的事情。选方向不能只看当下的热度还要估一下这个方向的知识和经验在多长时间内还有效。特别是去年很多大厂开了非常高的大包给算法岗我预言未来几年算法岗的竞争会越来越卷以至于可能性价比不是很高。大模型应用落地——保质期中等。具体的工具和框架会变今天用LangChain明天可能用别的但”怎么把模型用好”“怎么解决落地中的工程问题”这种方法论层面的经验保质期比较长。多模态——保质期较长。多模态是一个大的技术趋势不是一阵风。即使具体的模型架构会迭代”让模型理解和生成多种模态的信息”这个方向在可预见的未来都是重要的。纯AIGC图像/视频生成——保质期不确定。这个领域技术迭代极快半年前的SOTA可能现在就过时了。你积累的具体技术经验可能贬值很快但底层的数学基础和对生成模型的理解是持久的。纯语言LLM——保质期存疑。不是说LLM不重要了而是”纯语言”这个定语的保质期在缩短。未来的模型大概率都是多模态的”只懂处理文本”可能会变成一种局限。考虑二你的起点在哪这一点经常被忽视但其实非常关键。硕士的时间很短你不可能从零开始在一个全新的方向做到有竞争力。你必须基于你已有的积累来选择方向。说得直白一点你本科阶段和研一上学期做过什么会很大程度上限定你的选择范围。几种常见的起点和对应的建议如果你本科做过NLP相关的工作文本分类、信息抽取、机器翻译等你往大模型应用落地方向转是最自然的。你对文本处理的基础理解可以直接复用学习曲线最平滑。如果你的NLP基础特别扎实也可以往大模型训练和对齐方向冲一冲但可能需要补分布式训练的知识。如果你本科做过CV相关的工作目标检测、图像分割、图像生成等你往多模态方向转有天然优势。现在多模态领域最缺的就是同时懂CV和NLP的人而你已经有了一半的基础。补上Transformer和LLM的基础知识之后你在多模态方向的竞争力会比纯NLP背景的人更强——因为NLP的人想做多模态也得补CV而CV的基础通常比NLP更难补。如果你本科做过传统机器学习或数据挖掘推荐系统、CTR预估等你可以考虑大模型在推荐/搜索/广告场景的应用。这是一个很实际的落地方向大厂有大量的岗位需求。你对业务指标和特征工程的理解是大模型背景的人通常不具备的这可以成为你的差异化优势。如果你本科啥都没做过或者做的方向跟AI关系不大——那说实话两年时间要做到有竞争力挑战不小。我的建议是选一个入门门槛相对低、但可以通过项目积累深度的方向也就是大模型应用落地。避开需要大量研究积累才能出成果的方向基座模型训练、AIGC底层研究等。并且实在不行自己做一些小产品就使用AI做一些小产品然后自己看看能不能盈利这个我觉得是一个很好的想法。考虑三不要忽视”组合稀缺性”这个概念是我跟mentor聊天时他提到的我觉得特别有启发。在就业市场上单一能力的价值是递减的——会用大模型的人越来越多你再怎么卷也只是”又一个会用大模型的人”。但两种能力的组合往往能产生远超单项之和的价值。 因为同时具备两种能力的人数量比只具备一种的人少得多。几个我观察到的高价值组合大模型 系统工程 → 能把模型稳定高效地跑在线上极度稀缺 大模型 垂直行业知识 → 能在金融/医疗/法律等领域做深度落地 大模型 数据工程 → 能搞定从数据清洗到模型训练的全链路 多模态 端侧部署 → 能在手机/车载等资源受限场景做多模态 NLP CV → 多模态方向的理想人选你选方向的时候不要只想”我在哪个方向上能做到top”也想想”我能不能组合两个方向形成一个独特的定位”。后者在求职时的辨识度比前者高得多。面试官每天看到的简历里”做过大模型微调”的一大把但”做过大模型微调并且能自己写推理优化代码把延迟降下来”的人就少很多了。四、我自己最后怎么选的说了这么多分析交代一下我自己的选择不然显得光说不练。我最终选的是大模型应用落地方向同时有意识地在工程能力上做深度投入。原因很坦诚第一我本科的积累偏NLP往这个方向转最顺畅时间成本最低。第二我对自己的定位很清醒——我不是那种能在两年内做出顶会paper的选手。与其在研究方向上跟大佬硬卷不如在应用落地方向上用工程深度做差异化。这更符合我的能力结构。第三这个方向的岗位数量最多就业市场上的容错空间最大。万一某个细分方向冷了我的基础能力还能让我往相邻方向迁移。第四我对系统工程确实有兴趣。做RAG系统的过程中我发现自己花在工程优化上的时间比花在模型调优上的时间多而且前者比后者更让我有成就感。这个自我认知帮我确认了”应用工程”这个定位是适合我的。选完之后我做了几件具体的事情来落地这个选择研究课题围绕RAG和Agent系统展开但重点不是提出最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】