ChatGPT之父為何說「語言模型是死路」？

AI巨擘楊立昆離開Meta後創立新公司，質疑大型語言模型發展方向，提出「世界模型」新路徑。這場AI技術路線之爭將如何影響未來？

創造ChatGPT底層技術的科學家，現在卻說這項技術是「死胡同」。

2024年11月，楊立昆（Yann LeCun）結束了在Meta超過十年的首席AI科學家生涯。時機耐人尋味：僅僅六個月前，馬克·祖克柏才砸下數十億美元，成立專門研究室要用大型語言模型打造「超級智慧」，還找來年僅28歲的Scale AI創辦人王亞歷山大來領導。

這位65歲的圖靈獎得主沒有選擇留下當長老，而是決定重新開始。

語言模型的根本缺陷

楊立昆的新創公司Advanced Machine Intelligence Labs在2025年1月推出官網，開宗明義地宣告：「真正的智慧不是從語言開始，而是從世界開始。」

這個觀點並非楊立昆獨有。越來越多頂尖AI研究者認為，業界對語言模型的執著造成了某種「隧道視野」，真正通往智慧機器的道路應該是「世界模型」。

當前AI系統的問題在於，它們其實什麼都不「理解」。大型語言模型被訓練來預測序列中的下一個詞。它們在這方面表現驚人，足以寫詩、除錯程式碼、通過醫學執照考試。但本質上，它們只是模式匹配機器，對現實如何運作沒有內在理解。

廣告合作

[email protected]

這種局限性很明顯。要求影片生成AI展示有人放下咖啡杯、一分鐘後再拿起來，結果杯子可能變色、在桌上移動，或完全消失。AI沒有物體恆存概念——這是大多數兒童在一歲前就掌握的認知技能。

「世界模型」的新願景

楊立昆等人提出的替代方案，是建構基於世界實際運作方式內在模型的AI系統。想像你伸手拿咖啡杯之前，能預測它會是溫熱沉重的，預期手臂需要如何移動。現在的AI能寫關於咖啡的詩，卻不能為你倒咖啡。這就是研究者想要在機器中建構的理解力。

這個概念吸引了頂尖人才和資金。被稱為「AI教母」的李飛飛離開史丹佛大學創辦World Labs，最近推出能從文字提示生成可探索3D環境的產品Marble。Google DeepMind開發了Genie 3，能創造逼真虛擬世界讓AI代理人透過試錯學習。輝達的黃仁勳支持世界模型作為操控機器人和自駕車「物理AI」的關鍵。連馬斯克的xAI都加入戰局，從輝達挖角人才建構遊戲用世界模型。

最大投資仍流向語言模型

儘管如此熱絡，世界模型仍是副線押注。AI領域最大的支票依然開給語言模型公司。OpenAI、Anthropic和Google正投入數百億美元，擴大楊立昆認為注定失敗的方法。

楊立昆並非首位提出這些質疑的人，也絕非孤軍奮戰。自GPT-3問世以來，研究者就質疑語言模型能否達成真正智慧，世界模型概念也可追溯至數十年前。世界模型面臨自身障礙：建構精確模擬成本高昂，虛擬訓練環境能否捕捉現實的完整複雜性仍不明確，模擬中學到的技能能否順利轉移到物理世界也無保證。

語言模型的根本缺陷

「世界模型」的新願景

最大投資仍流向語言模型

觀點

記者

相關文章