Anthropic 与亚马逊、微软和谷歌合作开发 AI 越狱评估框架
内容摘要
在美国商务部解除出口限制后,Anthropic 正向全球恢复 Claude Fable 5 的使用。为应对安全挑战,该公司开发了一项新型安全分类器,能够拦截超过 99% 的越狱尝试。此外,Anthropic 正在与亚马逊、微软和谷歌等合作伙伴共同制定一项共享框架,旨在通过评估攻击的破坏力和影响范围,建立衡量 AI 越狱严重程度的统一行业标准。
(来源:Blocknow: Be ready. Be informed)