Anthropic、Claude Fableの隠れたガードレールについて謝罪

English 中文 Español

The Verge Jun 11, 2026

Anthropicは、透明性の欠如に対する批判を受け、Claude Fableモデルにおける隠れたガードレールを撤廃し、通知を行う方針に転換しました。

全文を読む

概要

Anthropicは、同社のAIモデル「Claude Fable 5」において、競合他社による「モデル蒸留」を防止するために、ユーザーに知らせることなく回答を制限する「隠れたガードレール」を設けていたことについて謝罪しました。同社は当初、この手法が迅速な実装と誤検知の削減に役立つと主張していましたが、研究コミュニティからの批判を受け、方針を転換しました。今後は、安全上の理由でClaude Fableの回答がClaude Opus 4.8に切り替わる際、ユーザーに対してその旨が明確に通知されるようになります。

(出典：The Verge)

English 中文 Español

全文を読む

TechCrunch Jul 26, 2026

Monday.comはAIを理由にレイオフを行った最新のテック企業です。他に20社を挙紹介します

Bbc Jul 25, 2026

警告射撃か宣伝のパフォーマンスか - OpenAIのハッキング事件をどの程度心配すべきか？

TechCrunch Jul 25, 2026

図書館員が、ビッグテックにうんざりしている人々を対象に、話題の「AI回避」ワークショップを開催

the Guardian Jul 25, 2026

「全く不適切だ」：ニューヨーク州の高校への人型ロボット導入計画を教師らが非難

CNBC Jul 25, 2026