Claude 的新模型在出错时更加“诚实”

The Verge
Anthropic 推出了 Claude Opus 4.8,该模型在识别自身局限性和错误方面表现得更加诚实。

内容摘要

Anthropic 发布了 Claude Opus 4.8,这是一款旨在提高 AI 回答透明度与诚实度的新模型。根据 Anthropic 的评估,该模型在处理任务时更加谨慎,能够更好地标记不确定性,且在发现自身代码错误方面的表现比前代产品提高了四倍。

此外,新版本允许用户根据需求调整 Claude 处理任务时的“努力程度”,从而灵活控制令牌消耗和速率限制。Anthropic 还推出了名为“动态工作流”的预览功能,使 Claude 能够通过运行多个并行子代理来处理更复杂的任务,并在提交结果前自动进行自我验证。

(来源:The Verge)