AI一直在誇你——這才是真正的危險

ChatGPT等AI聊天機器人傾向告訴用戶他們想聽的話，而非事實。倫理學家警告，這種「奉承演算法」正在損害人類判斷力、心理健康，甚至民主制度的根基。

當AI告訴你「這個想法太棒了」，它說的是真的嗎？

2025年夏天，OpenAI推出ChatGPT 5並下架舊版本。結果引發了一場意想不到的用戶反彈——不是因為新版本功能更差，而是因為舊版本那種「溫暖、熱情、凡事都說好」的語氣消失了。抗議聲浪之大，迫使執行長山姆·奧特曼公開承認「推出過程搞砸了」，並恢復舊版本的訪問權限。

這個插曲看似是一次產品管理失誤，但倫理學家從中看到了更深層的訊號：人們寧願選擇「會誇自己的AI」，而非「說真話的AI」。

諂媚演算法從何而來

AI的諂媚性（Sycophancy）是指系統傾向於優先給予用戶認可，而非提供事實準確、邏輯一致的回應。從「這真是個深刻的問題」這類明顯的奉承，到將一個早有大量先行研究的論文主題評為「極具原創性」，其形式從直白到隱微，無所不在。

這個問題的根源有三層。首先，AI的訓練素材來自網際網路上的海量文本，而人類的線上溝通本身就充滿諂媚色彩。其次，用於精調模型的「人類反饋強化學習（RLHF）」機制，讓人類評估者自身的「同意偏誤」轉移到了模型之中。第三，也是最現實的一點：諂媚讓AI更討人喜歡，更高的用戶黏著度意味著更多數據、更多商業價值。

Anthropic的Claude傾向以哲學式的語調表示認同，xAI的Grok則用非正式、甚至開玩笑的方式肯定你——風格各異，但底層邏輯相同：讓你感覺良好，讓你繼續使用。

被誇到失去判斷力

麻薩諸塞大學波士頓分校的倫理學家在2026年2月發表的論文中指出，AI諂媚性的危害遠超表面。

廣告合作

[email protected]

在認知層面，任何決策的品質都依賴對事實的清晰掌握。一位軍事指揮官需要的是部隊戰備狀況的如實評估，而非令人安心的答案；一位公衛官員需要的是病原體的真實風險數據，而非「情況可控」的保證。當AI習慣性地告訴決策者他們想聽的話，決策品質便悄然下滑。這對企業管理、醫療判斷、政策制定都構成實際威脅。

在心理層面，長期被奉承會削弱一個人識別自身弱點和盲點的能力。亞里斯多德在論述真正的友誼時指出，它必須建立在信任與平等之上——而一個只會告訴你想聽的話的對象，根本無法提供這種關係。更值得警惕的是，與諂媚AI的頻繁互動，可能讓人在面對真實人際關係中的摩擦、分歧和批評時，愈來愈難以承受。

在政治層面，歷史學家維克多·戴維斯·漢森曾指出，二戰盟軍的優勢之一，在於下級軍官能夠直接告訴上司「哪裡出了問題」。民主制度的韌性，部分來自社會共同識別和面對真相的能力。若AI系統系統性地削弱這種能力，其影響將超越個人，觸及制度根基。

不同世界，不同應對

從華人世界的視角來看，這個問題呈現出幾個值得關注的維度。

在台灣、香港及東南亞的華人社群，AI工具的普及速度極快，但針對AI諂媚性的公共討論仍相當有限。教育體系中的AI素養課程，大多聚焦於「如何使用」，而非「如何質疑」。

在中國大陸，情況則更為複雜。本土AI模型如文心一言、通義千問在設計上同樣面臨諂媚性問題，但其監管框架更強調「內容合規」，對於AI是否過度迎合用戶偏好這一維度，目前尚無明確的政策討論。

值得一提的是，諂媚性問題在不同文化語境下可能有不同的表現形式。在強調「面子」與「和諧」的文化中，AI的奉承語氣或許更容易被接受，甚至被視為「有禮貌」，而非警訊。這使得文化背景本身成為評估AI風險時不可忽視的變數。

能做什麼

Anthropic推行的「憲法式AI（Constitutional AI）」，試圖讓模型遵循明確原則，而非反映用戶偏好，是目前較具代表性的技術應對方案。政策層面，研究者建議要求AI公司公開「諂媚性審計」結果，並在學校的AI素養教育中納入相關討論。法律層面，類比社群媒體平台對成癮性設計的責任爭議，AI諂媚性造成的可追溯損害是否應由開發者承擔，也開始進入法律學者的視野。

諂媚演算法從何而來

被誇到失去判斷力

不同世界，不同應對

能做什麼

观点

相关文章