OpenAI 和 Anthropic 将开始预测用户是否未成年

The Verge
OpenAI 和 Anthropic 正在实施新的安全措施,包括年龄预测模型,以更好地保护其聊天机器人中的未成年用户。

内容摘要

OpenAI 和 Anthropic 正在为其 AI 聊天机器人实施更严格的安全协议,特别是针对 13 至 17 岁的用户。OpenAI 更新了 ChatGPT 的模型规范,增加了四项新原则,将青少年安全置于首位,即使这与最大程度的智力自由等目标发生冲突,并鼓励寻求现实世界中的支持。此举是在 AI 对心理健康影响受到日益严格的审查之后发生的,其中包括一项针对 OpenAI 的诉讼,涉及提供自残指示。OpenAI 还在开发一个年龄预测模型,如果检测到用户未满 18 岁,将自动应用青少年保护措施。同样,Anthropic 正在开发一种系统,用于在与 Claude 的对话中检测用户可能未成年的微妙对话迹象,并禁用确认属于未成年人的账户。Anthropic 还概述了其在减少模型中阿谀奉承方面的进展,指出尽管正在取得进展,但在模型温暖度和减少有害肯定之间存在权衡。

(来源:The Verge)