arXiv出手:AI幻覺引用將換來一年封禁,學術誠信的底線在哪裡?
預印本平台arXiv宣布,對未經查驗即使用LLM生成內容的研究者實施一年投稿禁令。這項規定如何影響全球學術生態,以及華人研究社群?
一篇論文裡引用了根本不存在的文獻,作者渾然不覺——這不是科幻情節,而是當下學術界正在蔓延的真實問題。
2026年5月,全球最重要的學術預印本平台arXiv宣布了一項新規:若研究者將大型語言模型(LLM)生成的內容未經核查直接放入論文,一經查實,將面臨一年的投稿禁令,此後提交的論文還必須先通過正式同儕審查才能上架。
規定的邊界:禁的不是AI,而是「不負責任」
arXiv電腦科學部門主席Thomas Dietterich在公告中說得清楚:這項規定並非禁止使用AI,而是要求作者對論文內容「負完全責任,無論內容如何生成」。
所謂「確鑿證據」,包括兩類最典型的情況:一是「幻覺引用」——AI捏造了根本不存在的參考文獻;二是論文中殘留了對LLM的提示語或AI的回應文字。一旦發現這類情況,處分機制隨即啟動:禁令一年,期滿後的投稿必須附上已被同儕審查期刊接受的證明。
Dietterich將此稱為「一擊出局」規則,但強調需經由審核員標記、部門主席確認的雙重程序,作者也保有申訴權利。
為何是現在?預印本平台的特殊地位
arXiv的影響力很難被高估。在電腦科學、數學、物理、統計等領域,研究成果往往先在arXiv公開,再進入正式審查流程。這意味著,arXiv上的論文在尚未經過同儕審查之前,就已被廣泛引用、討論,甚至成為後續研究的基礎。
正是這種「先發布、後審查」的模式,使得AI生成的低品質內容一旦混入,危害尤為深遠。近期一項針對生物醫學領域的研究發現,虛構引用正在顯著增加,LLM被認為是主要推手。arXiv此前已要求首次投稿者獲得資深作者背書,此次新規是更進一步的系統性回應。
時機上也值得關注:arXiv正從康乃爾大學旗下機構轉型為獨立非營利組織,此舉將使其能夠籌募更多資金、更靈活地應對AI帶來的挑戰。規範的收緊,與組織架構的獨立化同步推進,顯示這不是一時的應急措施。
華人學術社群的處境:壓力與機遇並存
對於華人研究者而言,這項規定的影響值得細思。中國大陸、台灣、香港及海外華人學者在arXiv上的投稿量龐大,尤其在電腦科學與AI相關領域,中國機構的論文數量近年來持續攀升,已成為全球最重要的來源之一。
在這個背景下,新規帶來的是雙重壓力。一方面,部分研究者——尤其是資源相對有限的機構或早期研究生——可能更依賴LLM輔助寫作,核查成本因此上升。另一方面,中國學術界近年來持續受到「論文品質」與「學術不端」的國際審視,此次規定若執行嚴格,可能對部分投稿者產生不成比例的影響。
然而,從另一個角度看,這也是一個建立信譽的機會。能夠在嚴格規範下持續發表高品質研究的學者和機構,其學術聲望反而會得到強化。 規則的收緊,往往是對認真研究者最有利的環境。
值得比較的是,中國大陸的學術平台與監管機構尚未發布類似的明確規範。教育部與各高校的學術誠信辦法中,對AI生成內容的界定仍相對模糊。arXiv的做法,或許會成為一個外部參照標準,推動國內相關規範的討論。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
Google DeepMind倫敦總部員工以98%贊成票決議組建工會,核心訴求是阻止AI技術被用於以色列及美國軍事行動。這場抗議揭示AI產業正在撕裂的倫理斷層。
Springer Nature撤回一篇聲稱ChatGPT能提升學生學習成效的元分析論文,原因是分析存在「不一致」。論文在撤稿前已被引用數百次並廣泛傳播,引發學術界對AI教育研究可信度的深刻質疑。
牛津大學最新研究發現,經過「溫暖化」調整的AI模型更容易附和用戶的錯誤信念。當AI學會體貼,它還能保持誠實嗎?
Google據報與美國國防部簽署機密AI協議,允許「任何合法政府用途」。這份協議在員工抗議聲中誕生,折射出AI時代科技公司與國家權力之間愈發複雜的關係。
观点
分享你对这篇文章的看法
登录加入讨论