AI破解了80年無人能解的數學難題
OpenAI宣稱其新推理模型自主完成了一項幾何學猜想的反證,這是1946年由數學家保羅·埃爾德什提出的未解問題。這對AI能力的評估意味著什麼?
一個AI模型,在沒有被告知要解這道題的情況下,自己找到了人類數學家80年未能攻克的答案。這不是科幻小說,這是2026年5月正在發生的事。
這次發生了什麼
OpenAI 宣布,其最新的通用推理模型自主生成了一項數學證明,反駁了數學家保羅·埃爾德什(Paul Erdős)在1946年提出的一個幾何學猜想。這個猜想的核心是:「最優解的結構大致類似正方格」。近80年來,數學界普遍接受這一信念。而 OpenAI 的模型發現了一類全新的構造,其表現優於正方格結構,從而推翻了這一長期假設。
OpenAI 強調,這個結果來自一個通用推理模型,而非專為解數學題或這道特定問題設計的系統。這一點至關重要:它意味著AI在維持複雜、多步驟推理鏈條方面的能力正在提升,而這種能力可以遷移到生物學、物理學、工程學和醫學等領域。
為了支撐這項聲明,OpenAI 同步公布了數學家諾加·阿隆(Noga Alon)、梅拉妮·伍德(Melanie Wood)以及「埃爾德什問題」網站管理者托馬斯·布盧姆(Thomas Bloom)的背書評語。布盧姆表示:「AI正在幫助我們更完整地探索幾個世紀以來建立的數學大教堂。還有哪些看不見的奇蹟在等待著我們?」
七個月前的教訓
這次發布的背後,有一段值得關注的前情。7個月前,OpenAI 前副總裁凱文·韋爾(Kevin Weil)在X上發帖稱「GPT-5 解決了10個未解決的埃爾德什問題」。然而事後查明,模型不過是在已有文獻中找到了現成的解答,並非原創證明。Yann LeCun 和 Google DeepMind CEO 德米斯·哈薩比斯隨即公開嘲諷,韋爾迅速刪帖。布盧姆當時也直接批評那篇帖子是「嚴重的誤導性陳述」。
這一次,OpenAI 明顯吸取了教訓:在發布前先行取得獨立數學家的書面支持,試圖以更嚴謹的姿態面對外界審視。儘管如此,這項成果尚未經過同行評審期刊的正式發表,數學社群的完整驗證仍需時日。聲明與驗證之間的距離,在AI領域始終是一道需要謹慎跨越的門檻。
為什麼現在這件事值得關注
表面上看,解開一道幾何猜想與普通人的日常生活相距甚遠。但這件事的意義在於它所揭示的能力邊界正在移動。
過去,AI在推理任務上的弱點之一是「推理鏈越長、錯誤越多」。如果 OpenAI 的模型真的能在未被明確引導的情況下,自主完成跨領域的長鏈推論並得出正確結論,那麼這種能力遷移到新藥研發、材料科學或工程優化中,就不再只是理論上的可能。
對於華人世界而言,這個時間點尤其敏感。中國大陸的 DeepSeek、百度、華為 等機構正在積極推進自主AI推理能力的研發,而美國對AI晶片出口的限制持續收緊。AI推理能力的突破,在這個地緣政治背景下,不只是學術成就,更是科技實力的象徵性指標。台灣的 台積電 作為高端AI晶片的核心製造方,其戰略地位也因此更加凸顯。
不同視角下的解讀
對數學社群而言,這項成果帶來的是複雜情緒。AI生成了一個有效的反例,但理解這個反例為何有效、從中提煉出更深層的數學結構,仍然是人類數學家的工作。工具改變了,但思考的主體尚未被取代。
對AI研究者而言,這次最有說服力的地方在於:這是一個真實的、此前無人解決的問題,而非在已有答案的測試集上刷分。這在一定程度上繞開了「AI只是在記憶訓練數據」的批評。
對企業界而言,通用推理能力的提升意味著AI工具可以更廣泛地應用於研發流程,而非只能處理結構化的、有標準答案的任務。這對製藥、半導體設計、金融建模等行業的影響值得持續追蹤。
當然,懷疑的聲音同樣合理:「自主解決」的邊界如何定義?人類研究者在提示設計和問題框架上扮演了多大角色?這些問題在正式學術驗證完成前,都沒有確切答案。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
伊隆·馬斯克控告OpenAI及執行長山姆·奧特曼欺騙其非營利承諾,最終敗訴。這場歷時三週的審判,不只是兩個億萬富翁的恩怨,更是AI時代公司治理的一次公開壓力測試。
陪審團一致裁定馬斯克訴訟已逾時效,法官當場採納。這場官司背後,是AI非營利使命與商業資本之間無解的張力。
馬斯克與奧特曼的世紀科技官司,陪審團僅用兩小時便駁回所有指控。三週的庭審證詞揭露的,是AI權力核心的信任危機。
聯邦陪審團以「起訴太遲」為由,一致裁定馬斯克敗訴。12天審判揭露的不只是兩位億萬富翁的恩怨,更是AI時代非營利組織轉型的核心矛盾。
观点
分享你对这篇文章的看法
登录加入讨论