网络安全研究人员对 Anthropic 的 Fable 模型中的护栏感到不满
内容摘要
Anthropic 最近发布了其专业网络安全模型 Mythos 的公开版 Fable。然而,该模型遭到了行业专家的强烈批评,他们认为其安全护栏限制过多。研究人员报告称,该人工智能经常拦截无害请求(如代码审查或阅读安全博客),因为它错误地将这些内容归类为与恶意软件或生物安全相关的潜在威胁。虽然一些专家承认这是预防滥用的早期预防措施,但他们批评该系统依赖宽泛的关键词触发机制,从而妨碍了正常的网络安全和软件工程工作。
(来源:TechCrunch)