Liabooks Home|PRISM News
AI破解了80年無人能解的數學難題
科技AI分析

AI破解了80年無人能解的數學難題

4分钟阅读Source

OpenAI宣稱其新推理模型自主完成了一項幾何學猜想的反證,這是1946年由數學家保羅·埃爾德什提出的未解問題。這對AI能力的評估意味著什麼?

一個AI模型,在沒有被告知要解這道題的情況下,自己找到了人類數學家80年未能攻克的答案。這不是科幻小說,這是2026年5月正在發生的事。

這次發生了什麼

OpenAI 宣布,其最新的通用推理模型自主生成了一項數學證明,反駁了數學家保羅·埃爾德什(Paul Erdős)在1946年提出的一個幾何學猜想。這個猜想的核心是:「最優解的結構大致類似正方格」。近80年來,數學界普遍接受這一信念。而 OpenAI 的模型發現了一類全新的構造,其表現優於正方格結構,從而推翻了這一長期假設。

OpenAI 強調,這個結果來自一個通用推理模型,而非專為解數學題或這道特定問題設計的系統。這一點至關重要:它意味著AI在維持複雜、多步驟推理鏈條方面的能力正在提升,而這種能力可以遷移到生物學、物理學、工程學和醫學等領域。

為了支撐這項聲明,OpenAI 同步公布了數學家諾加·阿隆(Noga Alon)、梅拉妮·伍德(Melanie Wood)以及「埃爾德什問題」網站管理者托馬斯·布盧姆(Thomas Bloom)的背書評語。布盧姆表示:「AI正在幫助我們更完整地探索幾個世紀以來建立的數學大教堂。還有哪些看不見的奇蹟在等待著我們?」

七個月前的教訓

這次發布的背後,有一段值得關注的前情。7個月前OpenAI 前副總裁凱文·韋爾(Kevin Weil)在X上發帖稱「GPT-5 解決了10個未解決的埃爾德什問題」。然而事後查明,模型不過是在已有文獻中找到了現成的解答,並非原創證明。Yann LeCunGoogle DeepMind CEO 德米斯·哈薩比斯隨即公開嘲諷,韋爾迅速刪帖。布盧姆當時也直接批評那篇帖子是「嚴重的誤導性陳述」。

這一次,OpenAI 明顯吸取了教訓:在發布前先行取得獨立數學家的書面支持,試圖以更嚴謹的姿態面對外界審視。儘管如此,這項成果尚未經過同行評審期刊的正式發表,數學社群的完整驗證仍需時日。聲明與驗證之間的距離,在AI領域始終是一道需要謹慎跨越的門檻。

PRISM

廣告合作

[email protected]

為什麼現在這件事值得關注

表面上看,解開一道幾何猜想與普通人的日常生活相距甚遠。但這件事的意義在於它所揭示的能力邊界正在移動。

過去,AI在推理任務上的弱點之一是「推理鏈越長、錯誤越多」。如果 OpenAI 的模型真的能在未被明確引導的情況下,自主完成跨領域的長鏈推論並得出正確結論,那麼這種能力遷移到新藥研發、材料科學或工程優化中,就不再只是理論上的可能。

對於華人世界而言,這個時間點尤其敏感。中國大陸的 DeepSeek百度華為 等機構正在積極推進自主AI推理能力的研發,而美國對AI晶片出口的限制持續收緊。AI推理能力的突破,在這個地緣政治背景下,不只是學術成就,更是科技實力的象徵性指標。台灣的 台積電 作為高端AI晶片的核心製造方,其戰略地位也因此更加凸顯。

不同視角下的解讀

對數學社群而言,這項成果帶來的是複雜情緒。AI生成了一個有效的反例,但理解這個反例為何有效、從中提煉出更深層的數學結構,仍然是人類數學家的工作。工具改變了,但思考的主體尚未被取代。

對AI研究者而言,這次最有說服力的地方在於:這是一個真實的、此前無人解決的問題,而非在已有答案的測試集上刷分。這在一定程度上繞開了「AI只是在記憶訓練數據」的批評。

對企業界而言,通用推理能力的提升意味著AI工具可以更廣泛地應用於研發流程,而非只能處理結構化的、有標準答案的任務。這對製藥、半導體設計、金融建模等行業的影響值得持續追蹤。

當然,懷疑的聲音同樣合理:「自主解決」的邊界如何定義?人類研究者在提示設計和問題框架上扮演了多大角色?這些問題在正式學術驗證完成前,都沒有確切答案。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]