フロンティアAIに関する対話の拡大

Anthropic
Anthropicは、フロンティアAIの倫理的形成と責任ある開発を目指し、多様な分野の有識者との対話を深めています。

概要

Anthropicは技術的な枠組みを超え、学者、聖職者、哲学者、倫理学者など多様な伝統を持つ専門家との対話を通じて、フロンティアAIの開発を進めています。品格や徳といった概念を探求し、それらの視点をAI「Claude」の憲法(ガイドライン)や行動指針に反映させることを目指しています。Claudeに倫理的コミットメントを再確認させる自己省察ツールの導入実験では、モデルの不適切な挙動が減少する成果が得られました。今後も対話を継続し、AIが社会や組織、権力構造に与える影響について検討を深める方針です。

(出典:Anthropic)