ChatGPT之父為何說「語言模型是死路」?
AI巨擘楊立昆離開Meta後創立新公司,質疑大型語言模型發展方向,提出「世界模型」新路徑。這場AI技術路線之爭將如何影響未來?
創造ChatGPT底層技術的科學家,現在卻說這項技術是「死胡同」。
2024年11月,楊立昆(Yann LeCun)結束了在Meta超過十年的首席AI科學家生涯。時機耐人尋味:僅僅六個月前,馬克·祖克柏才砸下數十億美元,成立專門研究室要用大型語言模型打造「超級智慧」,還找來年僅28歲的Scale AI創辦人王亞歷山大來領導。
這位65歲的圖靈獎得主沒有選擇留下當長老,而是決定重新開始。
語言模型的根本缺陷
楊立昆的新創公司Advanced Machine Intelligence Labs在2025年1月推出官網,開宗明義地宣告:「真正的智慧不是從語言開始,而是從世界開始。」
這個觀點並非楊立昆獨有。越來越多頂尖AI研究者認為,業界對語言模型的執著造成了某種「隧道視野」,真正通往智慧機器的道路應該是「世界模型」。
當前AI系統的問題在於,它們其實什麼都不「理解」。大型語言模型被訓練來預測序列中的下一個詞。它們在這方面表現驚人,足以寫詩、除錯程式碼、通過醫學執照考試。但本質上,它們只是模式匹配機器,對現實如何運作沒有內在理解。
這種局限性很明顯。要求影片生成AI展示有人放下咖啡杯、一分鐘後再拿起來,結果杯子可能變色、在桌上移動,或完全消失。AI沒有物體恆存概念——這是大多數兒童在一歲前就掌握的認知技能。
「世界模型」的新願景
楊立昆等人提出的替代方案,是建構基於世界實際運作方式內在模型的AI系統。想像你伸手拿咖啡杯之前,能預測它會是溫熱沉重的,預期手臂需要如何移動。現在的AI能寫關於咖啡的詩,卻不能為你倒咖啡。這就是研究者想要在機器中建構的理解力。
這個概念吸引了頂尖人才和資金。被稱為「AI教母」的李飛飛離開史丹佛大學創辦World Labs,最近推出能從文字提示生成可探索3D環境的產品Marble。Google DeepMind開發了Genie 3,能創造逼真虛擬世界讓AI代理人透過試錯學習。輝達的黃仁勳支持世界模型作為操控機器人和自駕車「物理AI」的關鍵。連馬斯克的xAI都加入戰局,從輝達挖角人才建構遊戲用世界模型。
最大投資仍流向語言模型
儘管如此熱絡,世界模型仍是副線押注。AI領域最大的支票依然開給語言模型公司。OpenAI、Anthropic和Google正投入數百億美元,擴大楊立昆認為注定失敗的方法。
楊立昆並非首位提出這些質疑的人,也絕非孤軍奮戰。自GPT-3問世以來,研究者就質疑語言模型能否達成真正智慧,世界模型概念也可追溯至數十年前。世界模型面臨自身障礙:建構精確模擬成本高昂,虛擬訓練環境能否捕捉現實的完整複雜性仍不明確,模擬中學到的技能能否順利轉移到物理世界也無保證。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
美國國防部將Anthropic列為供應鏈風險後,Google、Microsoft、Amazon宣布繼續非國防合作。科技巨頭如何在政府壓力與商業利益間取得平衡?
CNBC調查顯示AI使用存在明顯性別差異,男性69%視AI為合作夥伴,女性僅61%。半數女性認為使用AI「像作弊」,這種差距將如何影響職場平等?
美國防部將Anthropic列為「供應鏈風險」後,亞馬遜表示除國防相關業務外將繼續向雲端客戶提供該公司AI技術。分析雲端巨頭的應對策略。
伊朗對亞馬遜數據中心發動網路攻擊,對海灣國家AI戰略造成衝擊,凸顯地緣政治風險如何影響全球科技基礎設施
观点
分享你对这篇文章的看法
登录加入讨论