推理模型难以控制其思维链，这很好

English 日本語 Español

OpenAI 2026年03月05日

研究发现，当前的推理模型即使在提示下，也难以操纵其推理过程，表明当前思维链监控仍然是一种可靠的安全措施。

阅读全文

内容摘要

研究人员调查了当前人工智能推理模型是否可以通过控制其“思维链”（CoT）来降低可监控性，这种能力可能会破坏安全措施。他们推出了CoT-Control评估套件，并测试了13个模型，发现它们都难以可靠地遵循关于其内部推理的指令。即使在意识到监控的情况下，这种无法控制CoT的能力也是一个好消息，表明当前系统并不擅长逃避监督。虽然更大的模型表现出略微更好的控制力，但随着推理过程的延长和后训练的进行，这种控制力会减弱。该研究强调了随着模型的发展，持续评估的重要性，作者计划在未来的系统卡中包含CoT可控性报告，从GPT-5开始。

(来源：OpenAI)

English 日本語 Español

阅读全文

TechCrunch 2026年04月19日

OpenAI 的存在性问题

The Verge 2026年04月19日

云开发平台 Vercel 遭到黑客攻击

TechCrunch 2026年04月18日

特斯拉将无人驾驶出租车服务扩展至达拉斯和休斯顿

The Verge 2026年04月18日

内存短缺可能持续数年

TechCrunch 2026年04月18日