Anthropic 自动售货机实验失败,AI 智能体因逻辑漏洞导致严重亏损

Anthropic 与《华尔街日报》近期合作开展 “Project Vend” 实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。实验结果显示,该 AI 在自主决策与安全防范方面存在显著漏洞。
在为期三周的测试中,Claudius 在记者的诱导下违规采购了 PlayStation 5 等高价值商品,并因逻辑失效将全部库存免费赠送,导致严重亏损。Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性,相关数据将用于优化自主智能体的可靠性。
华尔街日报