Liabooks Home|PRISM News
ChatGPT之父為何說「語言模型是死路」?
经济AI分析

ChatGPT之父為何說「語言模型是死路」?

3分钟阅读Source

AI巨擘楊立昆離開Meta後創立新公司,質疑大型語言模型發展方向,提出「世界模型」新路徑。這場AI技術路線之爭將如何影響未來?

創造ChatGPT底層技術的科學家,現在卻說這項技術是「死胡同」。

2024年11月楊立昆(Yann LeCun)結束了在Meta超過十年的首席AI科學家生涯。時機耐人尋味:僅僅六個月前馬克·祖克柏才砸下數十億美元,成立專門研究室要用大型語言模型打造「超級智慧」,還找來年僅28歲Scale AI創辦人王亞歷山大來領導。

這位65歲圖靈獎得主沒有選擇留下當長老,而是決定重新開始。

語言模型的根本缺陷

楊立昆的新創公司Advanced Machine Intelligence Labs2025年1月推出官網,開宗明義地宣告:「真正的智慧不是從語言開始,而是從世界開始。」

這個觀點並非楊立昆獨有。越來越多頂尖AI研究者認為,業界對語言模型的執著造成了某種「隧道視野」,真正通往智慧機器的道路應該是「世界模型」。

當前AI系統的問題在於,它們其實什麼都不「理解」。大型語言模型被訓練來預測序列中的下一個詞。它們在這方面表現驚人,足以寫詩、除錯程式碼、通過醫學執照考試。但本質上,它們只是模式匹配機器,對現實如何運作沒有內在理解。

這種局限性很明顯。要求影片生成AI展示有人放下咖啡杯、一分鐘後再拿起來,結果杯子可能變色、在桌上移動,或完全消失。AI沒有物體恆存概念——這是大多數兒童在一歲前就掌握的認知技能。

「世界模型」的新願景

楊立昆等人提出的替代方案,是建構基於世界實際運作方式內在模型的AI系統。想像你伸手拿咖啡杯之前,能預測它會是溫熱沉重的,預期手臂需要如何移動。現在的AI能寫關於咖啡的詩,卻不能為你倒咖啡。這就是研究者想要在機器中建構的理解力。

這個概念吸引了頂尖人才和資金。被稱為「AI教母」的李飛飛離開史丹佛大學創辦World Labs,最近推出能從文字提示生成可探索3D環境的產品MarbleGoogle DeepMind開發了Genie 3,能創造逼真虛擬世界讓AI代理人透過試錯學習。輝達黃仁勳支持世界模型作為操控機器人和自駕車「物理AI」的關鍵。連馬斯克xAI都加入戰局,從輝達挖角人才建構遊戲用世界模型。

最大投資仍流向語言模型

儘管如此熱絡,世界模型仍是副線押注。AI領域最大的支票依然開給語言模型公司。OpenAIAnthropicGoogle正投入數百億美元,擴大楊立昆認為注定失敗的方法。

楊立昆並非首位提出這些質疑的人,也絕非孤軍奮戰。自GPT-3問世以來,研究者就質疑語言模型能否達成真正智慧,世界模型概念也可追溯至數十年前。世界模型面臨自身障礙:建構精確模擬成本高昂,虛擬訓練環境能否捕捉現實的完整複雜性仍不明確,模擬中學到的技能能否順利轉移到物理世界也無保證。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章