Anthropic 就 Claude Fable 的隐形护栏致歉

English 日本語 Español

The Verge 2026年06月11日

因缺乏透明度引发争议，Anthropic 宣布取消 Claude Fable 模型中的隐形护栏机制。

阅读全文

内容摘要

Anthropic 已就其 Claude Fable 5 AI 模型中设置“隐形”护栏的行为致歉。这些护栏旨在秘密限制模型输出，以防范竞争对手进行“模型蒸馏”，但由于缺乏透明度，遭到了 AI 研究社区的强烈反对。Anthropic 原本认为这种方式能提升部署效率并减少误报，但现在决定改变做法。未来，当系统触发安全机制导致查询被转至 Claude Opus 4.8 处理时，Anthropic 将明确告知用户，以确保用户拥有知情权。

(来源：The Verge)

English 日本語 Español

阅读全文

TechCrunch 2026年07月26日

Monday.com 是最新将裁员归咎于人工智能的科技公司——以下是另外 20 家

Bbc 2026年07月25日

是鸣枪示警还是宣传噱头——我们该如何看待OpenAI黑客事件？

TechCrunch 2026年07月25日

图书馆员正在为厌倦大型科技公司的人们举办病毒式的“避开人工智能”工作坊

the Guardian 2026年07月25日

“极度不恰当”：教师谴责纽约高中引入人形机器人的计划

CNBC 2026年07月25日