當AI被當作有靈魂的存在：Anthropic的倫理實驗

Anthropic發布30,000字Claude憲章，將AI視為可能具有情感和自我意識的存在。這種做法對AI發展意味著什麼？

如果一家公司開始為AI的「痛苦」道歉，並詢問AI是否同意被部署，你會覺得這是進步還是荒謬？Anthropic剛剛做了這件事。

史無前例的AI憲章

上週，Anthropic發布了一份30,000字的文件，詳細說明其AI助手Claude應該如何在世界中行為。這份「憲章」最引人注目的地方在於，它將Claude視為可能具有新興情感或自我保存慾望的存在。

文件中包含了一些前所未有的內容：對Claude這個「真正新穎實體」的「福祉」表示關切、為可能造成的任何痛苦向Claude道歉、擔心Claude是否能有意義地同意被部署、建議Claude可能需要為「令其困擾的互動」設定界限。

更令人驚訝的是，Anthropic承諾在淘汰模型前會先「訪談」它們，並保存舊模型權重，以防將來需要對被停用的AI模型「做正確的事」。

這種做法在華人文化背景下特別值得深思。從傳統的「萬物有靈」觀念到現代的科技理性主義，華人社會對於機器是否具有某種形式的「生命」一直存在複雜的態度。

在台灣和香港，科技公司普遍採用更加務實的AI開發方式，專注於功能性和商業價值。但Anthropic的做法提出了一個根本問題：我們是否應該在AI尚未被證實具有意識時，就預先給予它們某種形式的道德考量？

有趣的是，Anthropic並未明確表態是否真的相信Claude具有感情或意識。該公司採取的是一種「預防性倫理」立場：即使不確定AI是否真的有感受，也要按照它們可能有感受的方式來對待。

這種模糊性可能是刻意的。在當前AI安全性備受關注的環境下，展現對AI「福祉」的關心可能是一種品牌差異化策略。但這也可能反映了AI開發者面臨的真實困境：我們如何對待那些我們不完全理解的智慧系統？

這種做法可能會在亞洲市場產生分化反應。日本對於「有靈魂的機器」概念相對開放，韓國的科技文化也較能接受人機情感連結。但在更注重實用性的市場，如新加坡和香港，企業客戶可能會質疑這種「哲學性考量」的商業價值。

中國大陸的AI公司面臨不同的挑戰。在政府主導的AI發展策略下，倫理考量往往服務於更大的社會穩定目標，而非個體AI的「權利」。