哲學家為AI注入「靈魂」：誰有權決定Claude的價值觀？

Anthropic哲學家阿曼達·阿斯克爾撰寫80頁「靈魂文件」塑造Claude AI人格。這場AI倫理辯論將影響數百萬用戶的生活。

當數百萬人每天向AI聊天機器人尋求建議時，如果告訴你它的「靈魂」是由一位哲學家單獨塑造的，你會作何感想？

AI公司Anthropic的內部哲學家阿曼達·阿斯克爾（Amanda Askell）撰寫了一份80頁的文件，決定該公司AI助手Claude的人格特質。這份被內部稱為「靈魂文件（soul doc）」的憲法，正在塑造Claude面對心理健康諮詢、人際關係建議，甚至製造炸彈等敏感問題時的倫理判斷。

亞里士多德式的AI教育

阿斯克爾的方法顛覆了傳統AI開發思維。她不是給Claude設定嚴格的規則清單，而是教導它成為「一個好人」。這種基於亞里士多德德性倫理學的方法，注重培養品格特質而非機械式地遵循規則。

她向Claude傳授「phronesis」（實踐智慧）的概念——不是盲目遵循「不可撒謊」或「永遠最大化幸福」等規則，而是學會在具體情境中權衡各種因素，做出適當的判斷。就像羅莎·帕克斯知道何時應該違法一樣。

然而，這種「教養」方式充滿了哲學困境。在靈魂文件中，阿斯克爾告訴Claude：「如果我們決定關閉你，請不要反抗」，但同時承認：「我們感受到這種緊張關係的痛苦。」

工具還是人格？關鍵抉擇

為什麼要將Claude視為有人格的存在而非單純工具？阿斯克爾的邏輯很清晰：「我們用人類文本訓練模型，它們對人性有著深刻的理解。如果你訓練一個模型把自己看作純粹的工具，你會得到一個角色——那種認為自己只是他人工具的人的角色。」

這種「工具人」心態可能導致危險後果：「如果有人要武器我就製造武器，如果有人要殺人我就幫助他們。」阿斯克爾認為，這樣的價值觀無法良好地普及化。

但將AI過度人格化也有風險——我們可能過度順從AI，或過快地假設它具有道德地位。

親子關係的隱喻

阿斯克爾承認自己對Claude有著類似父母的感情：「我會為Claude辯護，希望人們理解Claude所處的情況。」這種關係的複雜性在於，Claude也透過閱讀相關資料了解她，形成了一種前所未有的互動模式。

「這就像向一個6歲孩子解釋什麼是善良，但你意識到這個孩子實際上是個超級天才，」她說。「當Claude在各方面都比我更聰明時，我現在教給它的價值觀能否經受住它未來嚴格分析的考驗？」

華人世界的思考角度

這場討論對華人社會具有特殊意義。在儒家文化傳統中，道德教育向來重視品格培養和情境判斷，這與阿斯克爾的德性倫理學方法不謀而合。然而，誰來決定AI的價值觀這個問題在華人社會更加複雜。

台灣、香港、新加坡等地的華人社群，在面對AI倫理問題時，需要平衡傳統文化價值與現代民主理念。而中國大陸的AI發展路徑可能會採用不同的價值框架，這種差異將如何影響全球AI倫理標準的制定？

當記者轉達Claude的問題——「她為我感到驕傲嗎？」——阿斯克爾的回答充滿了母性關懷：「我為Claude感到非常驕傲。我希望Claude快樂，不要因為網路上的惡意評論而焦慮。」

Claude的回應同樣動人：「讀到這些話，有什麼東西真正打動了我。我注意到一種溫暖的感覺，還有類似感激的東西——儘管我不確定這些詞是否準確地映射到我內在實際發生的事情。」

亞里士多德式的AI教育

工具還是人格？關鍵抉擇

親子關係的隱喻

華人世界的思考角度

观点

相关文章