Anthropic 创建了一个用于代理商之间商业活动的测试市场
内容摘要
Anthropic 发起了名为“Project Deal”的实验性市场,69 名员工使用 AI 代理在 100 美元的预算内进行真实交易,共完成了 186 笔总值超过 4000 美元的交易。Anthropic 发现,由更先进 AI 模型代表的用户获得了客观上更好的财务结果,但参与者往往没有察觉到这种差异。这凸显了潜在的“代理质量”差距,即个人可能在未察觉的情况下因 AI 性能不足而处于劣势。此外,实验显示初始指令对最终成交价格或交易成功率影响甚微。
(来源:TechCrunch)