网络安全研究人员对 Anthropic 的 Fable 模型中的护栏感到不满

English 日本語 Español

TechCrunch 2026年06月10日

网络安全专家对 Anthropic 的 Fable 模型感到沮丧，因为其护栏过于宽泛，甚至会拦截与编程或研究相关的无害任务。

阅读全文

内容摘要

Anthropic 最近发布了其专业网络安全模型 Mythos 的公开版 Fable。然而，该模型遭到了行业专家的强烈批评，他们认为其安全护栏限制过多。研究人员报告称，该人工智能经常拦截无害请求（如代码审查或阅读安全博客），因为它错误地将这些内容归类为与恶意软件或生物安全相关的潜在威胁。虽然一些专家承认这是预防滥用的早期预防措施，但他们批评该系统依赖宽泛的关键词触发机制，从而妨碍了正常的网络安全和软件工程工作。

(来源：TechCrunch)

English 日本語 Español

阅读全文

Bbc 2026年07月25日

是鸣枪示警还是宣传噱头——我们该如何看待OpenAI黑客事件？

CNBC 2026年07月25日

从硅谷到华盛顿，科技界突然对人工智能的一个概念着迷：蒸馏

TechCrunch 2026年07月25日

I tried out OpenAI’s new AI keypad — which will be fun for some coders and slightly mystifying to everyone else

TechCrunch 2026年07月24日

Prentis, new AI lab co-founded by Reid Hoffman, Marc Pincus in talks to raise $100M

The Verge 2026年07月24日