Liabooks Home|PRISM News
前Meta高管挑戰LLM主流,推出「推理優先」AI新路徑
科技AI分析

前Meta高管挑戰LLM主流,推出「推理優先」AI新路徑

3分钟阅读Source

楊立昆支持的新創公司開發能量推理模型,聲稱用200萬參數就能超越大型語言模型。這是否代表AI發展的新方向?

200萬個參數解數獨,速度超越世界頂級大型語言模型數倍。這不是科幻小說,而是矽谷新創公司Logical Intelligence的現實成果。

1月21日,AI界傳奇人物楊立昆(Yann LeCun)正式加入Logical Intelligence董事會。這位剛離開Meta的研究巨擘,正在挑戰一個根深蒂固的信念:大型語言模型(LLM)是通往通用人工智能的唯一道路。

對「LLM信仰」的反擊

楊立昆在最近的訪談中直言,矽谷陷入了「群體迷思」,所有人都被「LLM洗腦」了。當整個科技界都在追求更大、更強的語言模型時,Logical Intelligence卻選擇了截然不同的路線。

該公司CEO伊芙·博德尼亞(Eve Bodnia)毫不客氣地批評現狀:「LLM就是一場大型猜謎遊戲。你餵給神經網路一堆網路垃圾,然後試圖教它人類如何溝通。」

她的觀點很直接:語言只是智能的表現形式,不是智能本身。「當你說話時,你的推理發生在某種抽象空間中,然後解碼成語言。人們卻試圖通過模仿語言來逆向工程智能。」

能量推理模型的突破

Logical Intelligence開發的Kona 1.0採用「能量推理模型」(EBM)架構。與LLM預測「下一個最可能的詞」不同,EBM吸收一組參數規則,在約束條件內完成任務。

博德尼亞用登山比喻解釋兩者差異:「LLM登山者看不到完整地圖,只能朝一個方向前進。遇到懸崖就會跳下去摔死。」相比之下,EBM能夠「多方向觀察,選擇路線,遇到障礙就換路」。

這種方法的優勢顯而易見:Kona 1.0僅用一台NVIDIA H100 GPU就能運行,參數量不到2億個,卻能在數獨等邏輯任務上大幅超越大型語言模型。

實際應用前景

Logical Intelligence瞄準的並非語言處理,而是需要零錯誤率的關鍵領域:

能源管理:即時處理多變量,根據需求自動分配電力。目前的系統會浪費大量未使用的能源,EBM有望實現精準配送。

製藥研究:藥物發現、癌症研究等需要複雜數據處理的領域。該公司已與大型晶片製造商和數據中心業者展開談判。

製造自動化:在容錯率極低的精密製造環境中,EBM的自我修正能力可能帶來革命性改變。

華人科技圈的機會

對於亞洲科技產業而言,這項技術發展值得密切關注。台灣的半導體產業、中國大陸的製造業,都可能從這種「推理優先」的AI架構中受益。

特別是在中美科技競爭的背景下,不依賴巨量數據和計算資源的EBM模式,可能為資源相對有限的地區提供「彎道超車」的機會。

AGI的多元路徑

Logical Intelligence與楊立昆的AMI Labs將密切合作,構建多層次的AI生態系統:LLM負責人機自然語言交互,EBM處理推理任務,世界模型幫助機器人在3D空間中行動。

博德尼亞強調,他們追求的不是「一個大腦統治一切」,而是為每個具體業務場景訓練專門的小型模型。這種「專業化」思路與當前「通用化」趨勢形成鮮明對比。

值得注意的是,該公司選擇不開源其模型。博德尼亞解釋:「這是邁向AGI的真正一步。我想在把它放到世界上之前,確保充分理解它的安全性、可能性和邊界。我想做一個負責任的父母。」

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章