前Meta高管挑戰LLM主流,推出「推理優先」AI新路徑
楊立昆支持的新創公司開發能量推理模型,聲稱用200萬參數就能超越大型語言模型。這是否代表AI發展的新方向?
200萬個參數解數獨,速度超越世界頂級大型語言模型數倍。這不是科幻小說,而是矽谷新創公司Logical Intelligence的現實成果。
1月21日,AI界傳奇人物楊立昆(Yann LeCun)正式加入Logical Intelligence董事會。這位剛離開Meta的研究巨擘,正在挑戰一個根深蒂固的信念:大型語言模型(LLM)是通往通用人工智能的唯一道路。
對「LLM信仰」的反擊
楊立昆在最近的訪談中直言,矽谷陷入了「群體迷思」,所有人都被「LLM洗腦」了。當整個科技界都在追求更大、更強的語言模型時,Logical Intelligence卻選擇了截然不同的路線。
該公司CEO伊芙·博德尼亞(Eve Bodnia)毫不客氣地批評現狀:「LLM就是一場大型猜謎遊戲。你餵給神經網路一堆網路垃圾,然後試圖教它人類如何溝通。」
她的觀點很直接:語言只是智能的表現形式,不是智能本身。「當你說話時,你的推理發生在某種抽象空間中,然後解碼成語言。人們卻試圖通過模仿語言來逆向工程智能。」
能量推理模型的突破
Logical Intelligence開發的Kona 1.0採用「能量推理模型」(EBM)架構。與LLM預測「下一個最可能的詞」不同,EBM吸收一組參數規則,在約束條件內完成任務。
博德尼亞用登山比喻解釋兩者差異:「LLM登山者看不到完整地圖,只能朝一個方向前進。遇到懸崖就會跳下去摔死。」相比之下,EBM能夠「多方向觀察,選擇路線,遇到障礙就換路」。
這種方法的優勢顯而易見:Kona 1.0僅用一台NVIDIA H100 GPU就能運行,參數量不到2億個,卻能在數獨等邏輯任務上大幅超越大型語言模型。
實際應用前景
Logical Intelligence瞄準的並非語言處理,而是需要零錯誤率的關鍵領域:
能源管理:即時處理多變量,根據需求自動分配電力。目前的系統會浪費大量未使用的能源,EBM有望實現精準配送。
製藥研究:藥物發現、癌症研究等需要複雜數據處理的領域。該公司已與大型晶片製造商和數據中心業者展開談判。
製造自動化:在容錯率極低的精密製造環境中,EBM的自我修正能力可能帶來革命性改變。
華人科技圈的機會
對於亞洲科技產業而言,這項技術發展值得密切關注。台灣的半導體產業、中國大陸的製造業,都可能從這種「推理優先」的AI架構中受益。
特別是在中美科技競爭的背景下,不依賴巨量數據和計算資源的EBM模式,可能為資源相對有限的地區提供「彎道超車」的機會。
AGI的多元路徑
Logical Intelligence與楊立昆的AMI Labs將密切合作,構建多層次的AI生態系統:LLM負責人機自然語言交互,EBM處理推理任務,世界模型幫助機器人在3D空間中行動。
博德尼亞強調,他們追求的不是「一個大腦統治一切」,而是為每個具體業務場景訓練專門的小型模型。這種「專業化」思路與當前「通用化」趨勢形成鮮明對比。
值得注意的是,該公司選擇不開源其模型。博德尼亞解釋:「這是邁向AGI的真正一步。我想在把它放到世界上之前,確保充分理解它的安全性、可能性和邊界。我想做一個負責任的父母。」
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
OpenAI推出免費AI論文寫作工具Prism,研究者擔心加劇學術期刊低品質論文氾濫問題
川普政府ICE行動引發AI生成抗議影片在社群媒體爆紅。當現實與虛構界線模糊,數位時代的抗議形式正在重新定義政治表達。
Google DeepMind公開Project Genie,60秒內從文字生成遊戲世界的AI工具,揭示娛樂產業與創造力的全新可能性。探討對亞洲市場的深遠影響。
Google為Chrome加入AI側邊欄與自動任務功能,與OpenAI、Perplexity等競爭對手展開激烈較量。瀏覽器的未來將如何改變?
观点
分享你对这篇文章的看法
登录加入讨论