4天超越人類2年苦功!NousCoder-14B 聯手 NVIDIA B200 震撼程式碼 AI 領域
Nous Research 發布 NousCoder-14B 程式碼模型,搭載 48 張 NVIDIA B200 僅訓練 4 天即可達到人類競技編程高手 2 年的水平。開源架構 Atropos 同步上線,挑戰封閉原始碼霸權。
AI 的演化速度已非人類所能想像。Nous Research近日發布了全新的開源模型「NousCoder-14B」,這款模型僅花費4天時間進行訓練,便在競技編程領域展現出與頂尖人類開發者比肩的實力。該過程動用了48張NVIDIA最新一代的「B200」繪圖處理器,其效率之高,引發業界廣泛討論。
NousCoder-14B 與 NVIDIA B200 引領的開發變革
這場技術突破的核心在於「強化學習」的極致應用。根據技術報告,研究員 Joe Li 將模型比作自己的編程之路。他曾在 14 至 16 歲間,花費整整2年時間在Codeforces平台上鑽研,才將評分從 1600 提升至 2100 以上;然而,NousCoder-14B在短短96小時內便完成了同樣的躍升。在LiveCodeBench v6評測中,該模型取得了67.87%的準確率,表現優於多款封閉原始碼的商業系統。
與Anthropic推出的「Claude Code」不同,Nous Research選擇了「激進的開放」。他們不僅公開了模型權重,更發布了完整的「Atropos」訓練架構,讓所有研究人員都能夠複製並驗證其研究成果。這種透明度在追求「黑箱」性能的現代 AI 競賽中顯得難能可貴。
面臨高品質數據枯竭的挑戰
然而,突飛猛進的背後也隱藏著危機。研究指出,NousCoder-14B幾乎耗盡了網路上所有可用的高品質、可驗證的競技編程題目。隨著數據資源趨於有限,未來 AI 的進化將依賴於「自我對弈」與「合成數據生成」。這意味著 AI 必須學會自己出題、自己解題,從而擺脫對人類現成數據的依賴。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
SpaceX傳出以600億美元收購AI程式設計平台Cursor,或支付100億美元授權費。這場科技巨頭搶奪AI編程工具的戰爭,對亞洲科技產業意味著什麼?
OpenAI推出月費100美元的ChatGPT Pro新方案,直接挑戰Anthropic的Claude Code。AI編程工具市場競爭白熱化,對亞洲開發者與企業意味著什麼?
OpenAI為Codex新增Plugin功能,對標Anthropic與Google。但真正的競爭不在功能多寡,而在於誰能定義AI編程的行業標準。華人科技圈該如何看待這場角力?
Microsoft與NVIDIA聯手推進「物理AI」,讓機器在真實環境中感知、推理並行動。這場轉型對亞洲製造業意味著什麼?華人世界的工廠又將如何應對?
观点
分享你对这篇文章的看法
登录加入讨论