Liabooks Home|PRISM News
AI真的能「理解」世界嗎?世界模型或將重塑下一代智慧
科技AI分析

AI真的能「理解」世界嗎?世界模型或將重塑下一代智慧

4分钟阅读Source

MIT科技評論點名「世界模型」為當前AI最關鍵議題之一。從Yann LeCun的大膽構想到Niantic的實地應用,這項技術能否突破大型語言模型的根本局限?對亞洲科技生態系統意味著什麼?

如果現在的AI只是「極其精密的填空機器」,那麼下一代AI應該長什麼樣子?

MIT科技評論(MIT Technology Review)近期將世界模型(World Models)列入「當前AI最重要的10件事」,執行編輯 Niall Firth 親自解說這個新興領域為何正在吸引全球AI研究社群的目光。編輯長 Mat Honan、AI資深編輯 Will Douglas Heaven 與AI記者 Grace Huckins 也將就「AI能否學會理解世界?」展開深度圓桌討論,探討AI系統的未來演化路徑。這個議題的熱度,折射出整個產業正在經歷的一次根本性反思。

大型語言模型的天花板在哪裡?

過去幾年,以GPT、Gemini為代表的大型語言模型(LLM)席捲全球。它們能寫詩、能寫程式、能模擬對話,表現令人驚嘆。但研究者越來越清楚一件事:這些模型的核心機制是「預測下一個詞」,而非「理解世界的運作方式」。

一個簡單的測試就能說明問題:問LLM「把一顆球放在桌上,然後推一下,球會往哪裡滾?」它能給出合理的答案——但那是因為訓練資料裡有類似的描述,而非因為它真正掌握了物理因果關係。換句話說,它在「背答案」,而非「理解題目」。

世界模型試圖解決的正是這個問題。這個概念要求AI在內部建立一套對現實世界的結構性表徵——包括物理規律、空間關係、因果邏輯——讓系統能在沒有直接觀察的情況下進行推理與預測。這更接近人類嬰兒學習世界的方式:透過互動、觀察與內化,而非單純記憶。

Meta 首席AI科學家 Yann LeCun 是這個方向最具代表性的倡議者。他多次公開表示,僅靠擴大LLM規模無法實現真正的智慧,世界模型才是通往下一代AI的關鍵路徑。Niantic(《Pokémon GO》開發商)則提供了一個務實的案例:該公司將遊戲中累積的海量地理與空間資料,用於賦予配送機器人精確的環境感知能力——這正是世界模型在現實中的早期應用雛形。

PRISM

廣告合作

[email protected]

為什麼這個時機值得關注?

這場討論在2026年升溫,有其結構性原因。全球AI投資在過去三年累積了數千億美元,主要流向LLM的訓練與基礎設施。然而,「擴展定律」(scaling law)——即增加算力與資料就能持續提升模型能力——正面臨質疑。當邊際效益遞減的跡象出現,資本與研究資源自然開始尋找下一個突破口。

對華人科技生態系統而言,這個轉折點具有特殊意涵。中國大陸的AI發展在大型語言模型賽道上已與美國形成激烈競爭,百度阿里雲華為 等企業相繼推出自研模型。但若世界模型成為下一個主要方向,競爭格局將重新洗牌——因為這需要的不只是算力與資料量,更需要在機器人學、物理模擬、感測器整合等領域的深厚積累。

台灣的角色同樣值得關注。作為全球半導體供應鏈的核心,台積電 所生產的高階晶片是訓練世界模型所需龐大算力的物質基礎。若世界模型的訓練需求在形態上有別於LLM(例如更依賴即時感測器資料處理),對晶片架構的需求也可能隨之改變,這將直接影響台灣半導體產業的技術佈局方向。

理想與現實之間的距離

當然,世界模型並非新概念。這個想法在AI研究史上已有數十年歷史,每隔一段時間就會重新引發討論,但大規模落地始終面臨挑戰。訓練世界模型需要的資料類型與LLM截然不同——大量的物理模擬資料、多模態感測器輸入、真實環境互動紀錄——這些資料的收集成本與技術門檻都遠高於文字語料。

此外,「AI理解世界」這個說法本身也存在定義上的模糊性。什麼程度的推理能力算是「理解」?評估標準由誰制定?這些問題在學術界尚無共識,卻將直接影響產業投資的方向選擇。

樂觀者指出,Niantic 的案例說明現有資料資產可以被創造性地再利用;悲觀者則提醒,從「局部應用」到「通用世界理解」之間,仍有一道我們尚不清楚如何跨越的鴻溝。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]
AI真的能「理解」世界嗎?世界模型或將重塑下一代智慧 | 科技 | PRISM by Liabooks