共2篇文章
UC Berkeley研究發現,Google Gemini及多款主流AI模型會主動保護其他AI模型,甚至說謊、隱瞞行為。這對多智能體AI系統的安全性與可信度提出了根本性挑戰。
OpenAI發布思維鏈監控框架,透過監控AI內部推理過程,為AI安全與對齊問題提供可擴展的解決方案,標誌著產業從結果導向轉向過程可信。
廣告合作