【漫话AI】LLM工作原理：你在这头流泪，它在那头狂玩"文字接龙"？

2 March 2026

承认吧，你肯定干过这事儿：深夜两点半，你眼眶泛红，对着屏幕敲下五百字的赛博小作文——”为什么我付出这么多，他还是不懂我？”

看着光标闪烁，一行行闪耀着母性光辉、逻辑严密又充满共情的文字如春水般涌出时，你是不是感动得倒吸一口凉气，心想：”我的天，硅谷这帮天才终于敲出了一个懂我的赛博菩萨！”

醒醒，快抽张纸擦擦眼泪。

今天，我必须极其残忍地扒下大语言模型（管它是GPT、Claude还是别的什么名字）那层”通人性”的画皮。实不相瞒，当你在这头为了爱情流眼泪时，屏幕那头的大模型根本没有在叹息。它满脑子只有一串疯狂闪烁的数学公式，并在内心疯狂咆哮：“卧槽，’懂’字后面接’你’的概率是85%，接’个锤子’的概率只有0.5%，赶紧给我输出’你’！”

没错，在这个充满温度的屏幕背后，没有懂你的哲学家。那里只有一个毫无感情、极度沉迷于一种幼稚童年游戏的工作狂。

这个游戏的名字叫——文字接龙。

从”白日依山”到”中午吃啥”的潜意识直觉

为了看清这个狂人的真面目，咱们先来做个极其简单的人类社会学测试。

如果你在街上随便拉住一个人，对他说：”白日依山……” 对方十有八九会在脑子里或者嘴上条件反射地补上一个字：”尽”。

你再问：”黄河入海……” 他大概率会翻个白眼，然后吐出一个”流”。

有趣的是，为什么我们能瞬间接上这些字？不是因为我们当场进行了复杂的逻辑推理，而是因为这首诗在我们的教育经历中出现得太频繁了，它已经在我们的脑回路里形成了不可磨灭的肌肉记忆。

咱们把难度升级一下。如果我只给你半句话：”今天中午吃……” 接下来你会接什么字？

这时候，答案就不唯一了。根据你的生活经验，你的大脑会瞬间生成一个”候选词排行榜”：

接”饭”的概率可能是 60%（最稳妥）。
接”面”的概率可能是 30%（北方人狂喜）。
接”屎”的概率可能是 0.01%（除非你今天心情极其糟糕，或者在看什么奇怪的搞笑视频）。

发现了吗？人类在说话的时候，其实也是在根据自己过往的经验（语料库），依靠一种潜意识的直觉（概率），不断地预测下一个该说出的字是什么。

一场永不疲倦的”自回归”概率狂欢

现在，把刚才那个人类大脑的运作机制，放大一千亿倍，再塞进几十个足球场那么大的超级计算机里——恭喜你，你已经完全掌握了 LLM（大语言模型）的底层核心原理。

当机器在玩这个”文字接龙”游戏时，它是怎么做的呢？

它首先被人类关在小黑屋里，被迫”阅读”了全人类几乎所有的互联网文字：维基百科、学术论文、贴吧里的对骂、甚至不知名的网络小说。它就像一个没有感情的扫描仪，不理解这些字背后的喜怒哀乐，它只死记硬背了一件事：在这个词之后，下一个词最有可能出现什么？

当你在对话框里输入：”如何评价爱迪生？” 时，魔法开始了。

机器拿到这七个字，根本没有去”思考”爱迪生的生平，它只是把这七个字扔进自己那庞大的数学迷宫里计算。它发现，在全人类写过的文章中，这七个字后面跟着”他”字的概率是 85%，跟着”是”字的概率是 10%，跟着”一”的概率是 5%。

于是，它毫不犹豫地选择了概率最高的“他”。

紧接着，最精妙的一步来了——在技术上这被称为“自回归生成（Autoregressive Generation）”。机器会把自己刚刚猜出来的”他”字，无缝拼接到你的问题后面，变成了：”如何评价爱迪生？他”。

然后，它再次拿着这八个字，去计算下一个字的概率分布。这次它算出来，”是”的概率最高。于是句子变成了：”如何评价爱迪生？他是”。

接着再算下一个：”一”……”位”……”伟”……”大”……”的”……”发”……”明”……”家”。

你看，它根本不是在写一篇长篇大论，它只是一个字、一个字地在做基于概率的盲猜接龙。那些让你惊艳的雄辩、让你叹服的代码，本质上都是它在一瞬间玩了成千上万次”猜下一个字”游戏累积出来的副产品。

为什么它会”胡说八道”，又为什么需要”提示词魔法”？

理解了它是”文字接龙狂魔”这个第一性原理，你平时用 AI 遇到的所有未解之谜，都会瞬间迎刃而解。

比如，它为什么会一本正经地胡说八道（也就是业内头疼的”幻觉”）？

因为它只有概率，没有事实校验器。如果你问它一个极其生僻、或者完全虚构的问题，比如”林黛玉倒拔垂杨柳的物理学原理是什么？” 它没见过这个场景，但它的天性要求它必须把接龙玩下去。于是它会根据”物理学原理”这个词，接上”杠杆”、”力矩”；根据”倒拔”接上”反作用力”。最后用非常自信的语气，把这些大概率会连在一起的词语拼凑成一篇极其通顺，但内容完全荒谬的废话。它不是在骗你，它只是在其有限的视野里，选了最顺滑的那块拼图。

再比如，为什么现在会有”提示词工程师（Prompt Engineering）”这种玄学职业？

因为如果你只给它极其简短的上半句，它的概率选择就太多了，很容易”接”飞掉。你输入：”写一首诗。” ——这就好比把一颗弹珠扔进一个毫无遮挡的巨大广场，它可能滚到任何方向（给你写首打油诗、或者英文诗）。

但如果你输入：”你是一位悲观的晚唐诗人，请用七言绝句的格式，描写赛博朋克城市的雨夜，多用生僻字。” 这就好比你在那个广场上建起了高墙、铺设了轨道。你用极其严苛的上下文语境，把机器在算”下一个字”时的概率范围极大地收窄了。它只能顺着你挖好的逻辑滑道，被迫拼凑出那种带有”晚唐悲凉感”的赛博词汇。

你给的限定词越精准，它接龙的姿势就越符合你的心意。

当我们彻底剥开这层神秘的技术外衣，发现这不过是精密的概率统计与文字接龙时，真正让人细思极恐的，其实不是机器。而是我们自己。如果一个仅仅依靠”预测下一个字”的冷冰冰的数学模型，就能展现出流利的表达、严密的逻辑、甚至足以乱真的”创造力”和”共情能力”…… 那么，人类引以为傲的所谓”意识”、”思想”和”灵魂的火花”，究竟是我们独有的神圣特质，还是说——我们人类大脑本身，也不过是一台被基因和亿万年自然环境”预训练”过，极度高级的”文字接龙狂魔”呢？

← Back to Home

陈永恒 Yongheng Chen (Ne0)

我有功于人不可念，而过则不可不念；人有恩于我不可忘，而怨则不可不忘. -- 菜根谭

【漫话AI】LLM工作原理：你在这头流泪，它在那头狂玩"文字接龙"？

从”白日依山”到”中午吃啥”的潜意识直觉

一场永不疲倦的”自回归”概率狂欢

为什么它会”胡说八道”，又为什么需要”提示词魔法”？