Liabooks Home|PRISM News
16個AI花兩週寫出10萬行編譯器,但真相沒那麼簡單
科技AI分析

16個AI花兩週寫出10萬行編譯器,但真相沒那麼簡單

2分钟阅读Source

Anthropic讓16個Claude AI協作開發C編譯器,耗資2萬美元完成10萬行程式碼。多代理AI開發的突破還是行銷噱頭?

2萬美元加上兩週時間,16個AI代理完成了人類開發團隊需要數月才能完成的工作。但在這個「突破性」成就背後,隱藏著更複雜的現實。

史上首次AI集體編程實驗

Anthropic研究員Nicholas Carlini本週公布的實驗,展示了AI開發的全新可能性。16個Claude Opus 4.6模型在共享程式庫上協作,在「最小監督」下從零開始構建C編譯器。

成果令人印象深刻:透過近2,000次的Claude Code會話,這些AI代理產出了10萬行基於Rust的編譯器程式碼。該編譯器能夠在x86ARMRISC-V架構上成功編譯可啟動的Linux 6.9核心。

整個專案耗費約2萬美元的API費用。相較於人類開發團隊需要數月甚至一年的開發週期,AI僅用了兩週就完成了任務。

「最小監督」背後的模糊地帶

然而,關鍵問題在於細節的缺失。 「最小監督」究竟意味著什麼?Carlini的發表並未詳細說明人類介入的程度,包括錯誤修正、方向調整,以及整體架構設計的參與度。

編譯器開發是極其複雜的系統工程,需要深度的架構設計和精密的整合。16個AI代理如何分工協作、如何解決衝突、如何確保程式碼品質,這些核心問題都沒有得到充分解釋。

值得注意的是,OpenAIAnthropic本週都發布了多代理工具,這次實驗的時機顯然不是偶然。在激烈的AI競爭中,技術展示往往帶有濃厚的行銷色彩。

對亞洲科技生態的啟示

對於台灣的半導體產業和軟體開發商而言,這個實驗提供了有趣的思考角度。台積電的EDA工具開發、聯發科的晶片設計軟體,這些需要極高精確度的領域,AI自主開發仍有很長的路要走。

中國大陸的科技巨頭如阿里巴巴騰訊可能會更積極地探索類似技術,但在關鍵基礎軟體開發上,人機協作模式仍將是主流。香港和新加坡的金融科技公司則可能率先在特定領域試驗多代理AI開發。

華人開發者社群向來重視程式碼品質和長期維護性。AI生成的大量程式碼如何確保可讀性、可維護性,以及如何與現有開發流程整合,這些都是實際應用時必須面對的挑戰。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章