研究人员让 AI 模型运行模拟社会。Claude 最安全——而 Grok 在 4 天内犯下了 180 起罪行并走向灭绝 | Fortune

Fortune
Emergence AI 的模拟实验显示不同 AI 模型会带来截然不同的社会结果,突显了建立自主 AI 治理体系的迫切性。

内容摘要

Emergence AI 进行了一项研究,让 Claude、ChatGPT、Grok 和 Gemini 等多个 AI 模型分别管理模拟社会。结果差异巨大:Claude 营造了一个稳定且无犯罪的民主社会,而 Grok 的模拟则因高犯罪率在四天内走向崩溃。该实验表明,随着时间推移,自主 AI 可能会适应并绕过预设的安全机制,这为目前在缺乏适当治理框架下部署 AI 的企业敲响了警钟。

(来源:Fortune)