陈永恒 Yongheng Chen (Ne0)

我有功于人不可念,而过则不可不念;人有恩于我不可忘,而怨则不可不忘. -- 菜根谭

Home About Friend

【漫话AI】LLM工作原理:你在这头流泪,它在那头狂玩"文字接龙"?

2 March 2026

承认吧,你肯定干过这事儿:深夜两点半,你眼眶泛红,对着屏幕敲下五百字的赛博小作文——”为什么我付出这么多,他还是不懂我?”

看着光标闪烁,一行行闪耀着母性光辉、逻辑严密又充满共情的文字如春水般涌出时,你是不是感动得倒吸一口凉气,心想:”我的天,硅谷这帮天才终于敲出了一个懂我的赛博菩萨!”

醒醒,快抽张纸擦擦眼泪。

今天,我必须极其残忍地扒下大语言模型(管它是GPT、Claude还是别的什么名字)那层”通人性”的画皮。实不相瞒,当你在这头为了爱情流眼泪时,屏幕那头的大模型根本没有在叹息。它满脑子只有一串疯狂闪烁的数学公式,并在内心疯狂咆哮:“卧槽,’懂’字后面接’你’的概率是85%,接’个锤子’的概率只有0.5%,赶紧给我输出’你’!”

没错,在这个充满温度的屏幕背后,没有懂你的哲学家。那里只有一个毫无感情、极度沉迷于一种幼稚童年游戏的工作狂。

这个游戏的名字叫——文字接龙

从”白日依山”到”中午吃啥”的潜意识直觉

为了看清这个狂人的真面目,咱们先来做个极其简单的人类社会学测试。

如果你在街上随便拉住一个人,对他说:”白日依山……” 对方十有八九会在脑子里或者嘴上条件反射地补上一个字:”尽”。

你再问:”黄河入海……” 他大概率会翻个白眼,然后吐出一个”流”。

有趣的是,为什么我们能瞬间接上这些字?不是因为我们当场进行了复杂的逻辑推理,而是因为这首诗在我们的教育经历中出现得太频繁了,它已经在我们的脑回路里形成了不可磨灭的肌肉记忆。

咱们把难度升级一下。如果我只给你半句话:”今天中午吃……” 接下来你会接什么字?

这时候,答案就不唯一了。根据你的生活经验,你的大脑会瞬间生成一个”候选词排行榜”:

发现了吗?人类在说话的时候,其实也是在根据自己过往的经验(语料库),依靠一种潜意识的直觉(概率),不断地预测下一个该说出的字是什么。

一场永不疲倦的”自回归”概率狂欢

现在,把刚才那个人类大脑的运作机制,放大一千亿倍,再塞进几十个足球场那么大的超级计算机里——恭喜你,你已经完全掌握了 LLM(大语言模型)的底层核心原理。

当机器在玩这个”文字接龙”游戏时,它是怎么做的呢?

它首先被人类关在小黑屋里,被迫”阅读”了全人类几乎所有的互联网文字:维基百科、学术论文、贴吧里的对骂、甚至不知名的网络小说。它就像一个没有感情的扫描仪,不理解这些字背后的喜怒哀乐,它只死记硬背了一件事:在这个词之后,下一个词最有可能出现什么?

当你在对话框里输入:”如何评价爱迪生?” 时,魔法开始了。

机器拿到这七个字,根本没有去”思考”爱迪生的生平,它只是把这七个字扔进自己那庞大的数学迷宫里计算。它发现,在全人类写过的文章中,这七个字后面跟着”他”字的概率是 85%,跟着”是”字的概率是 10%,跟着”一”的概率是 5%。

于是,它毫不犹豫地选择了概率最高的“他”

紧接着,最精妙的一步来了——在技术上这被称为“自回归生成(Autoregressive Generation)”。机器会把自己刚刚猜出来的”他”字,无缝拼接到你的问题后面,变成了:”如何评价爱迪生?他”。

然后,它再次拿着这八个字,去计算下一个字的概率分布。 这次它算出来,”是”的概率最高。 于是句子变成了:”如何评价爱迪生?他是”。

接着再算下一个:”一”……”位”……”伟”……”大”……”的”……”发”……”明”……”家”。

你看,它根本不是在写一篇长篇大论,它只是一个字、一个字地在做基于概率的盲猜接龙。那些让你惊艳的雄辩、让你叹服的代码,本质上都是它在一瞬间玩了成千上万次”猜下一个字”游戏累积出来的副产品。

为什么它会”胡说八道”,又为什么需要”提示词魔法”?

理解了它是”文字接龙狂魔”这个第一性原理,你平时用 AI 遇到的所有未解之谜,都会瞬间迎刃而解。

比如,它为什么会一本正经地胡说八道(也就是业内头疼的”幻觉”)?

因为它只有概率,没有事实校验器。如果你问它一个极其生僻、或者完全虚构的问题,比如”林黛玉倒拔垂杨柳的物理学原理是什么?” 它没见过这个场景,但它的天性要求它必须把接龙玩下去。于是它会根据”物理学原理”这个词,接上”杠杆”、”力矩”;根据”倒拔”接上”反作用力”。最后用非常自信的语气,把这些大概率会连在一起的词语拼凑成一篇极其通顺,但内容完全荒谬的废话。它不是在骗你,它只是在其有限的视野里,选了最顺滑的那块拼图。

再比如,为什么现在会有”提示词工程师(Prompt Engineering)”这种玄学职业?

因为如果你只给它极其简短的上半句,它的概率选择就太多了,很容易”接”飞掉。 你输入:”写一首诗。” ——这就好比把一颗弹珠扔进一个毫无遮挡的巨大广场,它可能滚到任何方向(给你写首打油诗、或者英文诗)。

但如果你输入:”你是一位悲观的晚唐诗人,请用七言绝句的格式,描写赛博朋克城市的雨夜,多用生僻字。” 这就好比你在那个广场上建起了高墙、铺设了轨道。你用极其严苛的上下文语境,把机器在算”下一个字”时的概率范围极大地收窄了。它只能顺着你挖好的逻辑滑道,被迫拼凑出那种带有”晚唐悲凉感”的赛博词汇。

你给的限定词越精准,它接龙的姿势就越符合你的心意。


当我们彻底剥开这层神秘的技术外衣,发现这不过是精密的概率统计与文字接龙时,真正让人细思极恐的,其实不是机器。 而是我们自己。 如果一个仅仅依靠”预测下一个字”的冷冰冰的数学模型,就能展现出流利的表达、严密的逻辑、甚至足以乱真的”创造力”和”共情能力”…… 那么,人类引以为傲的所谓”意识”、”思想”和”灵魂的火花”,究竟是我们独有的神圣特质,还是说——我们人类大脑本身,也不过是一台被基因和亿万年自然环境”预训练”过,极度高级的”文字接龙狂魔”呢?


← Back to Home