AI大模型到底强在哪?普通人该知道这些真相
说实话第一次体验AI大模型的时候我有点懵。不是因科技带来的那种令人震撼从而产生的懵懂之感, 而是存在着一种难以确切清晰表述的恍恍惚惚模样的感觉。这般感觉, 就好似对面仿佛坐着一个人, 此人乃是一个阅读过大量书籍之人, 还是一个话说起来有点絮絮叨叨啰嗦不已之人, 不过总体而言还算得上是较为靠谱的一个人之状态。但它明明只是一堆代码啊。此物究竟是怎样达致如此情形的, 其真的明晰我所表述的内容吗, 亦或是仅仅呈现出佯装理解的状貌呢?这些问题我猜你也想过。大模型真的“理解”语言吗坦白讲学术界到现在也没完全统一答案。从技术层面来讲, 大模型的工作模式实际上相当“愚钝”, 它仅仅依据先前出现的文字, 来推测接下来最具出现可能性的字或者词, 逐个进行预测下去, 最终拼接成一段话。不过, 你去试着和它交谈几句, 它居然能够接住你抛出的梗, 还能够领会你话里潜在的意思。那么, 这究竟可不可以算得上是“理解”? 句号。我本人倾向于觉得, 这属于一种“统计意义层面的领会”, 它未曾见识过世界, 然而它览阅过诸多人类所撰之文字, 它不清楚“苹果”是何种滋味, 可是它晓得苹果与水果、红色、甜这些词汇常常一同出现。这种理解跟我们人类的不一样但它确实存在。为什么大模型有时候会胡说八道这事儿用过的人应该都遇过。你向其询问一件历史事件确切的日期, 它十分肯定地给了你一个答复, 然而你去查证时, 却发现相差了三年。你让它推荐一本书, 它编造了一个书名以及作者, 听起来特别逼真, 可实际上这本书根本就不存在。这叫“幻觉”是大模型目前最大的痛点之一。事实上原因并非繁杂, 于做深度学习模型大数据训练期间, 所瞅见的各类依据纷繁复杂包括真实话语、虚语、谣言、段子以及仿若小说中的情节等, 大模型自己并无甄别开哪些属于事实依据, 哪些属于杜撰生成的能力, 它仅晓得这般一些词汇时常接连现于一起, 那么自己也就依样接连起来罢了。因此, 当你向它提出一个其并无十足把握的问题之际, 它会抉择“编造出一个貌似合乎情理的答案”, 而非表述“我不知晓”呀。岂能将这口锅, 全然甩给那个它去。毕竟在训练数据当中, 人类自身也着实没少进行胡说八道之举。训练一个大模型到底要花多少钱这个数字说出来可能会吓到你。公开资料表明, 训练一个有着千亿级别参数的大模型, 仅某次训练的成本, 一般就在数千万人民币这个数量级。此成本, 既不涵盖前期的数据采集、清洗以及标注, 也不包含后续的调优与部署。针对算力消耗的情况而言, 存在研究机构进行过估算, 对于训练一次GPT - 3级别的模型来说, 大概需要耗费1,287兆瓦时的电力。经过换算后, 这等同于一个普通中国家庭128年7个月的用电总量。那么究竟是为何大模型公司都处于疯狂融资的状态呢? 原因在于这一事物确实是极为耗费资金的。每日的电费是在不断消耗着资金, 提供算力的设备也是在持续耗费资金, 就连工程师所获取的薪资同样是在消耗着资金。普通人怎么用大模型才最值这个问题我觉得是最实际的。有不少人运用大模型时, 将之当作搜索引擎来使用, 问一次, 它就回答一段内容, 接着是下一个问题, 它又去回答一段内容。但这种用法其实浪费了它真正的潜力。我自己的经验是——把它当“助理”而不是“答案机”。当我处于需要撰写一个方案的状态时, 所想的并非是直接让它给予我一个方案, 而是期望它能给我十个不一样的切入点, 当我展开要去分析一个问题之际, 并非期望其告知我答案, 而是想要它把所有有可能的分析维度罗列出来。用它来拓宽思路而不是用它来替代思考。还有一个小技巧给它设定一个角色。它被告知“你是一个有20年经验的律师”, 与直接向它询问法律问题, 所获得的答案质量, 完全属于两回事, 这是由于它具备“角色”之后, 会从海量数据当中筛选出更契合这个角色的语言以及逻辑。大模型会让很多人失业吗我的判断是会但可能不是你想的那种方式。它不会致使所有人在一夜之间失去工作, 然而, 它会在“会运用它的人”与“不会运用它的人”之间, 形成一道日益变宽的鸿沟。有两位编辑, 他们的能力大致相近, 其中一位借助大模型来辅助进行选题工作, 并撰写初稿, 还要负责校对, 其效率提升了三四倍, 而另一位依旧在采用手动操作的方式。那么半年过后, 究竟谁会更具竞争力呢?有两名程序员, 他们的能力大致相近, 其中一名借助大模型辅助来编写代码, 查找程序漏洞, 生成测试用例, 另一名则完全依赖自身逐行敲写代码, 一年之后, 哪一个更具价值呢?不是大模型在淘汰人而是会用工具的人在淘汰不会用工具的人。这跟那件事, 在本质上, 没有存在差别, 当年出现了电脑普及的情况, 当年同样发生了互联网普及的情景, 同年之际也有手机普及事宜出现。大模型的未来会怎样说实话我不知道。不是那种谦虚的“我不知道”是真的看不清。现今的大模型, 其能力边界正处于快速扩张的状态, 一年之前它时常出现答非所问的情况, 如今已然能够进行写小说、编写代码、解答数学题以及分析法律条文等操作那么再过三年、五年又会是怎样的情形呢?另一方面, 它的问题显著, 它未拥真正意识, 莫具情感体验, 毫无价值观可言, 它全部的“价值观”, 皆源于训练数据中人类遗留的偏好, 若数据存有偏见, 它便带有偏见, 若数据呈现毒性症状, 它就具备毒性。技术会持续地向前迈进, 这是毫无悬念可言的现象。然而, 技术能抵达何处之所在, 于抵达那个特定位置之后又会出现何种状况, 这些方面问题的答案, 并不存在于代码之中, 而是掌握在每一个运用它的人手里。你用它来做什么比它本身能做什么重要得多。至少我是这么看的。