<p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">——從維特根斯坦看大語言模型(LLM)的能力與瓶頸</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">20 世紀(jì)哲學(xué)家 Ludwig Wittgenstein 在其著作 Tractatus Logico-Philosophicus 中寫下一句極具啟發(fā)性的命題:語言的邊界,就是世界的邊界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">他的意思并不是說世界真的只有語言那么大,而是說:人類能夠思考、理解和表達(dá)的世界,很大程度上被語言所限制。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">當(dāng)我們把這句話放到今天的大語言模型(LLM)身上,會(huì)發(fā)現(xiàn)它幾乎像一把鑰匙,直接打開了理解 AI 能力與局限的大門。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因?yàn)楫?dāng)前最先進(jìn)的 AI,本質(zhì)上正是一種建立在語言之上的智能系統(tǒng)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">一、LLM到底是什么?</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">所謂大語言模型(LLM),比如 GPT,其核心任務(wù)其實(shí)非常簡(jiǎn)單:根據(jù)已有文本,預(yù)測(cè)下一個(gè)最可能出現(xiàn)的詞。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">換句話說,它學(xué)習(xí)的是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 詞與詞之間的關(guān)系</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 句子結(jié)構(gòu)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 概念之間的語言關(guān)聯(lián)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 大量文本中的模式</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">通過訓(xùn)練數(shù)以萬億計(jì)的文字,模型逐漸形成一種能力:在語言空間中進(jìn)行高度復(fù)雜的推理與組合。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此,LLM 的智能本質(zhì)可以理解為:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">一種極其強(qiáng)大的語言統(tǒng)計(jì)系統(tǒng)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但這也帶來一個(gè)關(guān)鍵問題:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">語言是否等于世界?</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">答案顯然不是。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">二、語言只是世界的“描述”</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">在人類認(rèn)知中,語言只是理解世界的一種工具。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">我們的認(rèn)知通常經(jīng)歷這樣一個(gè)過程:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">世界 → 感知 → 概念 → 語言</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 看到火 → 感到熱 → 形成“火會(huì)燙”的概念 → 用語言描述</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 看到蘋果掉落 → 觀察規(guī)律 → 建立物理理論 → 用語言表達(dá)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">語言只是最后一步。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但 LLM 的情況完全不同。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它的學(xué)習(xí)路徑是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">語言 → 語言 → 語言</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它沒有:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 視覺經(jīng)驗(yàn)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 身體經(jīng)驗(yàn)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 物理互動(dòng)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 真實(shí)世界反饋</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此,大語言模型學(xué)習(xí)到的并不是世界本身,而是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人類如何描述世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">這就是所謂的“符號(hào)世界”。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">三、語言無法表達(dá)全部知識(shí)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">維特根斯坦曾提出一個(gè)重要觀點(diǎn):</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">有些東西只能被“顯示”,卻無法被“說出”。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">比如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 騎自行車</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 游泳</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 演奏樂器</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 運(yùn)動(dòng)平衡</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">這些技能很難通過語言完全表達(dá)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">即使你寫下幾萬字教程,一個(gè)從未騎過車的人依然很難學(xué)會(huì)騎車。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">原因是這些知識(shí)屬于一種特殊類型:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">默會(huì)知識(shí)(Tacit Knowledge)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它存在于:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 身體控制</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 感覺反饋</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 空間直覺</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而不是純粹的語言描述。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人類擁有身體和感官,因此能夠掌握這種知識(shí);</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而僅依賴文本訓(xùn)練的 LLM,很難真正理解它們。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">四、沒有世界模型的智能</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人類的理解依賴于一種非常重要的能力:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">世界模型(World Model)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">簡(jiǎn)單說就是:我們會(huì)在大腦中構(gòu)建一個(gè)關(guān)于世界如何運(yùn)作的模型。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 杯子掉地會(huì)碎</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 火會(huì)燙</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 門被推會(huì)打開</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">這種能力在兒童兩三歲時(shí)就已經(jīng)出現(xiàn)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而 LLM 的“理解”則主要來自文本統(tǒng)計(jì)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如,如果很多文本中出現(xiàn):</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">“杯子掉地會(huì)碎”</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">模型就會(huì)學(xué)習(xí)這種語言關(guān)聯(lián)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但它并沒有真正體驗(yàn)過:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 重力</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 材料強(qiáng)度</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 物理碰撞</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此在一些情況下,它的推理更像是:語言推理,而不是物理推理。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">這被稱為:符號(hào)落地問題(Symbol Grounding Problem)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">即:語言符號(hào)沒有真正“落地”到現(xiàn)實(shí)世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">五、為什么 LLM 很強(qiáng),但仍有限</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">盡管存在這些局限,LLM 仍然表現(xiàn)出令人驚訝的能力:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 寫作</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 翻譯</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 編程</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 總結(jié)知識(shí)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 進(jìn)行復(fù)雜對(duì)話</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">原因是:人類文明的大部分知識(shí),本身就是以語言形式存在的。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">歷史、法律、文學(xué)、哲學(xué)、科學(xué)論文……</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">幾乎全部是文本。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">LLM 的本質(zhì)其實(shí)可以理解為:對(duì)人類文本知識(shí)的一次巨大壓縮。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它把互聯(lián)網(wǎng)中的知識(shí)結(jié)構(gòu),壓縮進(jìn)一個(gè)神經(jīng)網(wǎng)絡(luò)中,并學(xué)會(huì)在其中進(jìn)行組合與推理。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此它在語言任務(wù)上表現(xiàn)得非常接近人類。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但這也意味著:它的能力上限,很可能被語言本身所限制。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">六、突破語言邊界的三條路線</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">許多 AI 研究者認(rèn)為,如果想讓 AI 走向更高層次的智能,就必須讓它超越純語言系統(tǒng)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">目前出現(xiàn)了三條重要探索路線。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">1 世界模型 AI</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">由 Yann LeCun 等研究者推動(dòng)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">目標(biāo)是讓 AI 學(xué)習(xí):</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 物理規(guī)律</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 因果關(guān)系</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 時(shí)間與空間結(jié)構(gòu)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而不僅僅是文本模式。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">2 具身智能(Embodied AI)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">讓 AI 擁有身體,通過與世界互動(dòng)學(xué)習(xí)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如機(jī)器人系統(tǒng):</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">Tesla Optimus humanoid robot</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">通過操作物體、移動(dòng)和感知環(huán)境,建立真實(shí)經(jīng)驗(yàn)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">3 腦仿真路線</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">另一種思路是直接模擬生物神經(jīng)系統(tǒng)。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 果蠅神經(jīng)連接圖</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> ? 小鼠腦圖譜</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">希望通過復(fù)制生物結(jié)構(gòu)來產(chǎn)生智能。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">七、一個(gè)新的理解</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">從這個(gè)角度看,維特根斯坦的那句話可以有一種新的解釋:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">如果智能只存在于語言之中,它就永遠(yuǎn)無法完全理解世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而今天的大語言模型,其實(shí)正處在這個(gè)階段:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它們生活在語言的宇宙里。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但真正的世界遠(yuǎn)遠(yuǎn)比語言復(fù)雜得多。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">結(jié)語</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">大語言模型的出現(xiàn),是人工智能歷史上的一次巨大飛躍。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它讓機(jī)器第一次能夠在語言層面與人類深入交流。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但從哲學(xué)角度看,它仍然處在一個(gè)重要的邊界上:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">語言的邊界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">未來人工智能是否能夠突破這一邊界,進(jìn)入真正理解世界的階段,也許將決定下一代 AI 技術(shù)的方向。</b></p>